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PROCEDE de dissociation DE LA MOLECULE D'HEMOGLOBINE 
EXTRACELLULAIRE WARENICOLA MARINA, CHAlNES PROTEIQUES 
CONSTITUANT LADITE MOLECULE ET SEQUENCES NUCLEOTIDIQUES 
CODANT POUR LESDITES CHAlNES PROTEIQUES 

La presente invention a pour objet un procede de dissociation de la molecule 
d'hemoglobine extraceUulaire d'Annelides, notamment d'Arenicola marina, ainsi que 
les chaines proteiques constituant ladite molecule. 

La presente invention a egalement pour objet les sequences nucleotidiques codant 
pour les chaines prdteiques susmentionnees, ainsi que le procede de preparation de ces 

sequences nucleotidiques. 

Le sang est un liquide complexe dont la fonction principale est de transporter 
l'oxygene et le gaz carbonique, afin d'assurer les processus respiratoires. C'est la 
molecule d'hemoglobine, que l'on trouve dans les hematies, qui assure cette fonction. 

La molecule d'hemoglobine de mammifere est formee par 1' assemblage de quatre^ 
chaines polypeptidiques fonctionnelles semblables deux a deux (2 chaines de globine dej. 
type a et 2 chaines de globine de type W . Chacune de ces chaines polypeptidiques. 
possede la meme structure tertiaire d'une molecule de myoglobine (Dickerson et Geis£ 

1983). v 
L'heme, site actif de l'hemoglobine, est un anneau protoporphyruuque 

tetrapyrrolique, contenant en son centre un unique atome ferreux. L'atome de fer, 
fixateur de l'oxygene, contracte 6 liaisons de coordinence : quatre avec les atomes 
• d'azote de la porphyrine, une avec 1'histidine proximale F8. : et une avec la molecule 
d'oxygene lors de l'oxygenation de la globine. 

On est actuellement confront6 aux problemes d'approvisionnement de sang, dus a 
la diminution des dons du sang par peur de contamination. Ainsi, la recherche de 
substituts sanguins s'est accel6ree au cours des dernieres annees. On cherche a 
concevoir des substituts sanguins artificiels capables d'eliminer les risques de 
transmission de maladies infectieuses, mais egalement a s'affianchir des problemes de 
compatibility des groupes sanguins. 

Jusqu'a present, les principales voies de recherche concerned la synthese de 
produits chimiques d'une part (Clark et Gollan, 1966) et la synthese de produits 
biplogiques d'autre part (Chang, 1957 ; Chang, 1964). 
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En ce qui concerne la premiere voie de recherche, on a utilise les 
perfluorocarbones (PFC). Les PFC sont des produits chimiques capables de transporter 
-p-oxygene etils peuvent dissoudre-une grande quantite de gaz, conxme i'-oxygene-eHe- 
dipxyde de carbone. ^ . 

Actuellement, on essaye de produire des emulsions de ces produits qui pourraient 
etre disperses dans le sang d'urie fa?on plus efficace (Reiss, 1991 ; Reiss, 1994 ; Goodin 
et-at7-t994)r 

L'avantage des PFC demeure dans leur capacite oxyphorique directement 
proportionnelle a la quantite d'oxygene se trouvant dans les poumons. Par ailleurs, en 
raison de l'absence de membrane a traverser, les PFC peuvent transporter Foxygene 
plus rapidement vers les tissus. Toutefois, on ne connait pas les effets a long terme de la 
retention de ces produits dans Forganisme. Lorsque ces produits ont ete utilises pour la 
premiere fois comme substitut sanguin dans les annees 1960 chez la souris (Clark et 
Gollan, 1966 ; Geyer et al., 1966 ; Sloviter et Kamimoto, 1967), les effets secondaires 
ont ete tres importants. Les PFC n'etaient pas elimines de la circulation d'une fa9on 
satisfaisante et s'accumulaient dans les tissus de Forganisme, ce qui provoquait des 
oed&mes. 

Dans les annees 1980, on a teste une nouvelle version de PFC en phase clinique. 
Mais les problemes de stockage, de cout financier, d' effets secondaires non negligeables 
et la faible efficacite de ce compose ont empeche F extension de sa commercialisation 
(Naito, 1978 ; Mitsuno etNaito, 1979 ; Mitsuno et Ohyanagi, 1985). 

Recemment, on a mis au point une nouvelle generation de PFC (PFBO 
perfluorooctylbromide). Un nouveau produit (Reiss, 1991) est en cours de test clinique 
aux Etats-Unis, mais on a deja constate qu'\me augmentation, de la quantite d'oxygene 
dans le sang peut engendrer une accumulation d'oxygene dans les tissus, ce qui est 
dangereux pour Forganisme (formation d'oxygene radicalaire de type superoxyde). 

Ainsi, malgre les progres realises au fur et a mesure, les effets secondaires de ces 
composes sont encore trop importants pour etre commercialises a grande echelle. 

En ce qui concerne la deuxieme voie de recherche, des chercheurs ont travaille sur 
la mise au point de substituts sanguins en modifiant la structure de Themoglobine 
naturelle (Chang, 1957 ; Chang, 1997). Pour obtenir un substitut sanguin de type 
hemoglobine modifiee, on utilise des hemoglobines provenant de microorganismes 
genetiquement modifies, ou d^origine humaine ou animale, notamment la molecule 
d'hemoglobine bovine. En effet, Fhemoglobine bovine est legerement differente de 
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1'hemoglobine humaine sur le plan immunologique, mais elle traiisporte plus facilement 
1'oxygene vers les tissus. Neanmoins, le risque de contamination virale ou de type 
encephalopathie spongiforme reste toujours important. 

Pour etre fonctionnelle, 1'hemoglobine doit etre en contact avec un effecteur 
allosterique le 2,3-diphosphoglycerate (2,3-DPG), present uniquement a l'interieur des 
globules rouges (Dickerson et Geis, 1983). De plus, sans le 2,3-DPG et d'autres 
elements presents dans les globules rouges comme la methemoglobine reductase, 
1'hemoglobine subit un processus d'auto-oxydation et perd sa capacite a transporter de 

1' oxygene ou du dioxyde de carbone. 

On pent eliminer ces processus en modifiant la structure de 1'hemoglobine, et plus 
precisement en stabilisant les liaisons faibles de la molecule tetramerique entre les deux 
dimeres a et P (Chang, 1971). De nombreuses modifications out ete testees : liaison 
covalente entre deux chames a, entre deux chaines P ou encore entre a et p (Payne, 

1973 ; Bunn et Jandl, 1968). 

On a egalement tente de polymeriser les molecules tetrameriques ou de les 
■ conjuguer avec un polymere nomme polyethylene glycol (PEG)(Nho et al., 1992). Ces , 

edifications out pour consequence de stabiliser la molecule et d'augmenter sa tafile, , 

empSchant son elimination par les reins. 

On a beaucoup etudie les Annelides pour leur hemoglobine extracellulaire k 
0 (Terwilliger, 1992 ; Lamy et al., 1996). Ces molecules d'hemoglobine extracellulaire * 

sent pr6sentes chez les trois classes d'Annehdes : Polychetes, Ohgochetes et Achetes et 
meme chez les Vestimentiferes. Ce sent des biopolymeres geants, constitues d'envxron 
200 chaines polypeptidiques appartenant a 6 ou 7 types differents que 1'on regroupe 
g6neralement en deux categories. La premiere categorie, comptant 144 a 192 elements, 
regroupe les chaines polypeptidiques dites "fonctionnelles" portant un site actrf et 
capables de lier reversiblement 1'oxygene ; ce sont des chames de type globme dont les 
masses sont comprises entre 15 et 18 kDa et qui sont tr6s similaires aux chames de type 
a et p de vert6brcs. La deuxieme categorie, comptant 36 a 42 elements, regroupe les 
chaines polypeptidiques dites de "structure" possedant peu ou pas de site actif maxs 
30 permettantl'assemblagedesdouziemes. 

Les premieres images obtenues sur des hemoglobines extracellulaires d' Ax6mcole 
(Roche et al., I960) ont r6vele des elements hexagonaux. Chaque molecule 
d'hemoglobine est constitu6e de deux hexagones superpo S 6s (Levin, 1963 ; Roche, 
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1965) que Ton a nommes bicouche hexagonale (hexagonal bilayer) et chaque hexagone 
est lui-meme forme par P assemblage de six elements en forme de goutte d'eau (Van 
Bruggen et- Weber, 1974 ; Kapp et Grewe, 1 9 84) r nommes- structure globidaire -creuse - - 
(hollow globular structure)(De Haas et al., 1996) ou "douzieme^ La molecule native est 
formee de douze de ces sous-unites, d'une masse moleculaire d> environ 250 kDa. 

Ainsi," le brevet firan^ais n°2 809 624 concerne Putilisatioh comme substitut 
-saiigum-d'teSmo^ — 
Pecosysteme intertidal, ledit substitut sanguin permettant d'eliminer les problemes de 

penurie de dons. 

Bien que Parchitecture globale de Phemoglobine de Arenicola marina soit 
connue, notamment gr&ce a son etude quaternaire fine par spectrometrie de masse (Zal 
et al., 1997), les sequences primaires des differentes cha&ies proteiques qui la 
composent ne le sont pas. 

Ainsi, la pr6sente invention a pour but de fournir les sequences proteiques qui 
composent la molecule d'hemoglobine & Arenicola marina. 

Un autre but de la presente invention consiste a fournir les premieres etapes de la 
synthese in vitro d'hemoglobine extracellulaire & Arenicola marina afin d'elaborer un 
substitut sanguin au moyen de procede de biochimie et de biologie moleculaire. 

Un autre but de la presente invention consiste a fournir un procede de pr6paration 
de la molecule d'hemoglobine, eventuellement simplifiee, par genie genetique, et ce 
afin notamment d'augmenter le stock de cette molecule dans le cadre d'une utilisation 
comme substitut sanguin. 

•La presente invention concerne un procede de dissociation de la molecule 
d'hemoglobine extracellulaire d'Annelides, notamment d'Arepcola marina, permettant 
Pobtention des dix chaines proteiques constituant ladite molecule, 

ledit procede etant caracterise en ce qu'il comprend une etape de mise en presence 
d'un echantillon d'hemoglobine extracellulaire d'Annelides, notamment & Arenicola 
marina avec au moins un agent dissociant, notamment un melange constitue de 
dithiothreitol (DTT) ou de chlorhydrate de tris(2-carboxyethyl)phosphine (TCEP) ou de 
beta-mercaptoethanol et d'un tampon de dissociation, pendant un temps suffisant pour 
separer les chaines proteiques les unes des autres. 

Par "hemoglobine extracellulaire" , on designe une hemoglobine non contenue 
dans les cellules et dissoute dans le sang. 
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L'expression "agent dissociant" designe un compose chimique capable de rompre 
les interactions faibles (hydrophobes, electrostatiques, hydrogenes...) ou fortes (ponts 
disulfures). 

Par "tampon de dissociation", on designe un liquide contenant un tampon 
permettant d'ajuster le pH et contenant des agents dissociants. 

Les dix chaines proteiques constituant la molecule d'hemoglobine extracellulaire 
d'Arenicola marina comprennent 8 chaines de type globine et 2 chaines de type 
structure. 

On rappelle que l'hemoglobine extracellulaire de Arenicola manna d'une masse 
de 3648 ± 24 kDa est constituee de 198 chaines polypeptidiques appartenant a 10 types 
differents regroupes en deux cat6gories : 

- la premiere (156 chaines) regroupe des chaines polypeptidiques dites 
"fonctionnelles" portant un site actif capable de tier r6versiblement l'oxygene ; ce sont 
des chaines de type globine dont les masses sont comprises entre 15 etl8 kDa ; ces 
chaines sont tres similaires aux chaines de types a et p des vertebres ; et 

_ la deuxieme (42 chaines) regroupe des chames polypeptidiques dites de . 
"structure" (ou "hnker") possedant peu ou pas de site actif mais permettant 1' assemblage s . 
des dod6cameres ; ces chames ont des masses moleculaires comprises entre 22 et 27 7 , 
kDa 

La presente invention concerne un procede de dissociation de la molecule. 
d'hemoglobine extracellulaire V Arenicola manna, permettant l'obtention des dix 
chaines proteiques constituant ladite molecule, 

ledit precede 6tant caracterise en ce qu'il comprend une etape de mise en presence 
d'un 6chantillon d'hemoglobine extraceUulaire V Arenicola ^marina avec un m61ange 
constitue de dithiothreitol (DTT) et d'un tampon de dissociation, pendant environ une 

heure a trois semaines. 

Un proc6de de dissociation avantageux de l'invention est caracteris6 en ce que le 
tampon de dissociation comprend 0,1 M de base Trisma (tris[hydroxym6thyl] 
aminomethane) et 0 a 10 mM d'EDTA ajuste a un pH compris d'environ 5 a environ 12. 

De P r6f6rence, ledit tampon de dissociation comprend de l'EDTA a une 
concentration d'environ 1 mM ajuste a un pH d'environ 10 avec une solution de soude 
2N. 

Selon un mode de realisation avantageux, le proced6 ' de dissociation de 
IWntion est caracterise en ce que les dix chames proteiques constituant ladite 
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molecule sont obtenues par la dissociation de quatre sous-unites par exemple en 
presence de DTT, lesdites sous-unites etant elles-memes obtenues par mise en presence 
d'un echantillon d%emoglobine extracellulaire d'Arenicola -marina avee differents - 

agents dissociants, notarnment un tampon de dissociation. .. . 

La molecule native se dissocie en sous-unites sous Taction d' agents dissociants 
non reducteurs. H n'y a done pas rupture des Uaisbns covalentes. Toutefdis, apres 

--?action^-un-agent--redueteur-(^oupure-des-Uaison^ 

reduites en chames polypeptidiques (chaines proteiques constitutes de l'assemblage 
d'acides amines). 

Les 4 sous-unites susmentionndes sont done : les monomeres, les dimeres, les 
trimeres et les dodecameres. 

Les monomeres sont des chames de globine. 

Les dimeres sous forme homo et heterodimeres sont des chames de structure. 

Les trimeres sont des assemblages covalents de trois chaines de globine. 

Les dodecameres sont constitu6s de 12 chames proteiques ; par exemple : 3 trimeres + 3 
monomeres, 2 trimeres + 6 monomeres, 1 trimere + 9 monomeres. 

On peut done obtenir les 10 chames proteiques soit en une seule etape par 
dissociation directe de l'hemoglobine extraeellulaire d'Arenicola marina, soit en deux 
etapes, l'une consistant en la dissociation de l'hemoglobine extracellulaire d'Arenicola 
marina en 4 sous-unites et l'autre en la dissociation desdites 4 sous-unites en dix 
chaines proteiques. 

La presente invention conceme egalement un procede de dissociation tel que 
defini ci-dessus, caracteris6 en ce que les agents dissociants utilisds pour obtenir les 4 
sous-unites susmentionnees sont les suivants : { 

- une solution tampon de dissociation comprenant : 0,1 M de base Trisma 
(tris[hydroxymethyl]aminomethane) et 0 a 10 mM d'EDTA ajuste a un pH 
compris d'environ 5 a environ 12, et 

- une solution d'uree dont la concentration est comprise d'environ 0,1 M a 
environ 8 M, et est notarnment egale a 3 M. 

La presente invention conceme egalement un procede de dissociation tel que 
defini ci-dessus, caracterise en ce que les agents dissociants pour obtenir les 4 sous- 
unites sont les suivants : 

- une solution tampon de dissociation comprenant 0,1 M de base Trisma et 1 

mM d'EDTA ajuste a pH 10, et 
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- 3 M d'uree. 

Le proc6d6 de dissociation de Invention permet d'obtenir une composition 
contenant le melange des dix chaines proteiques constituant la molecule d'hemoglobine 
extracellulaire d'Arenicola marina. 

La presente invention concerne egalement un procede de preparation de couples 
d'amorces a partir des chaines proteiques telles qu'obtenues selon le proc6de tel que 
defini ci-dessus, ledit procede etant caracterise en ce qu'il comprend les etapes 
suivantes : 

- l'isolement de chacune des dix chaines prot6iques constituant la molecule 
d'hemoglobine telles qu'obtenues selon le procede tel que d6fini ci-dessus, 

_ le microsequencage de chacune des dix chaines prot&ques isoltes 
susmentionnees par spectrometrie de masse, afin d'obtenir une microsequence 
correspondant a chacune des dix sequences constitutes de 5 a 20 acides amin6s, et - 

_ la determination de dix couples d'amorces degenerees a partir des. 

15 micros6quences susmentionnees. 

La premiere etape d'isolement des chaines proteiques est notamment effectuee par 
chromatographic liquide d'exclusion, anionique et phase inverse a partir du melange 
susmentionnt comprenant les dix chaines prot6iques constituant la molecule 
d'bimoglobine teUes qu'obtenues selon le procede de dissociation de l'invention. 
20 L'expression "microsequence" d6signe des fragments de sequences proteiques. 

Les microsequences susmentionnds peuvent provenir a la fois des extremites C- et 
N-terminales mais aussi de sequences internes. 

Ces microsequences peuvent etre obtenues par chromatographie liquide en phase 
• inverse ou a partir de gel 2D a partir d'h6moglobine purifiee d'Arenicola marina. 
25 Chaque pic ou tache a ete decoupe et dig6r6 par une protease. Les peptides ainsi obtenus 

ont ete extraits des gels et separes par capLC (chromatographie Uquide capillaire). Les 
fragments sont ensuite analysts par spectromttrie de masse. 

L'expression "couples d'amorces deg6nerees" designe des sequences 
nucleotidiques obtenues a partir de fragments de stquences proteiques. On parle 
30 d'amorces dtgenerees en raison de la d6gen6rescence du code gen6tique (plusieurs 

codons pour 1 acide amin6). 

La demiere 6tape de determination des couples d'amorces degener6es correspond 

a leur synthese. 

Cette etape permet d'obtenir a la fois des amorces sens et des amorces antisens. 
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La presente invention concerne egalement des couples d'amorces tels qu'obtenus 
selon le proced6 tel que d6fini ci-dessus, lesdits couples etant notamment ies suivants : 
*- -- a) Amorce sens : - - GAR* TGY GGN--CCN~TTR CAR CG SEQ1D NO": 9 " 
Amorce antisens : CCA NGC.NTC YTT.RTC RAA GCA SEQIDNO: 10 
b) Amorce sens : AN TGY GGN CCN CTN CAR CG SEQIDNO: 11 

Amorce antisens : CCA NGC NTC YTT RTC RAA GCA SEQIDNO : 12 

oy ^fnorce sefis : AAR~'im~AAR~ CAN ^AC "TGG SEQTO^NOTTJ ~ 

Amorce antisens : CCA NGC NCC DAT RTC RAA SEQ ID NO : 14 

d) Amorce sens : TGY TGY AGY ATH GAR GAY CG SEQ ED NO : 15 
Amorce antisens : CA NGC NYC RCT RTT RAA RCA SEQIDNO: 16 

e) Amorce sens: GAY GAY TGY GTN TGY CC SEQIDNO: 17 
Amorce antisens : ana CRA ART CRT CNC CRC A SEQIDNO: 18 



ou: 

R represente A ou G, 
Y represente C ou T, 
N represente A, G, C ou T, 
I represente l'inosine, 
D represente A, G ou T, 
H represente A, C ou T. 



La presente invention concerne egalement un precede de preparation de sequences 
nucleotidiques codant pour les chaines proteiques constituant la molecule 
d'hemoglobine d'Arenicola marina, a partir des amorces tdlles qu'obtenues selon le 
precede tel que defini ci-dessus, ledit procede etant caracterise en ce qu'il correspond a 
im procede d' amplification en chame par polymerase (PCR), comprenant une repetition 
d'au moins 30 fois du cycle constitue par les etapes suivantes : 

* la denaturation, par chauffage, de l'ADNc codant pour chacune des dix 

chaines proteiques constituant la molecule d'hemoglobine d'Arenicola marina, de 

fa9on a separer l'ADNc en deux brins monocatenaires, ledit ADNc etant obtenu a 

partir d'ARNm mature, 
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* I'hybridation des couples d'amorces tels qu'obtenus par le precede tel que 
defini ci-dessus aux brins d'ADNc monocatenaires susmentionn6s a une 
temperature adequate, pour obtenir des amorces hybridees, et 

* Elongation des amorces hybridees par une polymerase a une temperature 

adequate. 

L'ADNc codant pour les dix chatnes proteiques susmentionnees est obtenu a 
partir d'ARNm mature, ledit ARNm mature etant obtenu par purification a partir 
d'ARN totaux extraits sur des Arenicoles juveniles en pleine croissance, lesdits 
Arenicoles juveniles presentant un taux elev6 ^expression des difBrents ARN 
messagers. Tout organisme en pleine croissance va syndxetiser plus de proteines done 
plus d'ARNm. 

Si le cycle susmentionne est repete moins de 30 fois, 1' amplification de l'ADN est 
reduite. 

L'expression "denaturation par chauffage" designe la destructuration de la double 
helice d' ADN en deux brins monocatenaires. 

L'expression "hybridation a une temperature adequate" designe la reconnaissance 
par les amorces de leurs sequences complementary sur l'ADN matrice. 

L'expression "elongation a une temperature adequate" d6signe la synthese de bnn 

d' ADNc par la polymerase. 

Selon un mode de realisation avantageux, le proced6 de preparation de 1'invention 

est caracterise en ce que : 

- la premiere etape dudit precede est une 6tape de denaturation de l'ADNc 
codant pour chacune des dix chaines prot6iques constituant la molecule *hemoglobine 
VArenicola marina d'environ 10 secondes a environ 5 minutes a une temperature 
comprise d' environ 90°C a environ 110°C, 

- le cycle, repete environ 30 a 40 fois, comprend les etapes suivantes : 

* une etape de d6naturation de l'ADNc codant pour chacune des dix chaines 
proteiques constituant la molecule d'hemoglobine d'Arenicola marina 
d'environ 10 secondes a environ 5 minutes, a une temperature comprise 
d' environ 90°C a environ 1 10°C, 

* une etape d'hybridation des couples d'amorces de Invention aux brins 
d'ADNc monocatenaires susmentionnes pour obtenir des amorces 
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hybridees, d' environ 20 secondes a environ 2 minutes, a une temperature 
comprise d'environ 50°C a environ 56°C, 

* une 6tape • d' elongation- des amorces hybridees - - telles- -qtf obtenues 

precedemment par une polymerase d'environ 20 secondes a environ 1 
minute et 30 secondes, a une temperature comprise d'environ 70°C a 
environ 75°C, et 

--la-derniere -etapedu-procedeestrunc etaped' £Iongation-des-amorces-hybri<iees— 

telles qu'obtenues prec6demment par une polymerase d'environ 5 minutes a environ 
15 minutes a une temperature comprise d'environ 70°C a environ 75°C. 

La reaction de PCR du proc6de de l'invention est notamment effectu6e en 
presence d'ADNc (1 ul), d'amorce sens (lOO ng) et antisens (100 ng), de dNTP (200 
uM), de MgCl 2 (2 mM), de tampon PCR (fourni avec la polymerase)(l X, a la 
concentration du tampon), de la Taq polymerase (1 unite) et d'eau (25 ul qsp). 

La presente invention conceme egalement un proced6 de preparation tel que 
defini ci-dessus, caracterise en ce que les couples d' amorces utilises sont tels que 
definis precedemment. 

Un precede de preparation parucuherement avantageux selon l'invention est un 
proc6d6 de preparation tel que defini ci-dessus, caracterise en ce que le couple 
d'amorces utilis6 est le suivant : (gar tgy ggn ccn ttr car cg ; cca ngc ktc 
ytt rtc raa gca), R, Y et N etant tels que dermis ci-dessus, 
ledit proced6 etant caracteris6 en ce que : 

- la premiere etape du procede est une etape de denaturation de l'ADNc codant 
pour chacune des dix chaines proteiques constituant la molecule d'hemoglobine 
d'Arenicola marina, de 4 minutes a une temperature egale k 95°C, 

- le cycle, repete 35 fois, comprend les 6tapes suivantes : 

* une etape de denaturation de l'ADNc codant pour chacune des dix chaines 
proteiques constituant la molecule d'hemoglobine d'Arenicola marina, de 
30 secondes a une temperature 6gale a 95°C, 

* une etape d'hybridation des couples d'amorces de l'invention aux brins 
d'ADNc monocatenaires susmentionnes pour obtenir des amorces 
hybridees, de 30 secondes a une temperature 6gale a 56°C,. 
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* une 6tape d'elongation des amorces hybridees telles qu'obtenues 
precedemment par une polymerase de 40 secondes a une temperature egale 
a72°C,et 

- la demiere 6tapedu proced6 est une etape d'61ongationdes amorces hybridees 
telles qu'obtenues precedemment par une polym6rase de 10 minutes a une 
temp6rature egale a72°C, 

afin d'obtenir la sequence nucleotidique SEQ ID NO : 1. 

La sequence nucleotidique SEQ ID NO :1 est une nouvelle sequence 
nucleotidique codant pour une chaine proteique correspondant a une chaine de globine, 
notee A2 (a). SEQ ED NO : 1 comprend 376 nucleotides. 

Un procede de preparation particulierement avantageux selon l'invention est un 
proc6de de preparation tel que defini ci-dessus, caracterise en ce que le couple 
d'amorces utilise est le suivant : (an tgy ggn ccn ctn car cg ; cca ngc ntc ytt 
rtc RAA gca), N, Y et R 6tant tels que definis ci-dessus, 

ledit procede etant caracteris^ en ce que : - 

- la premiere etape du procede est une etape de d6natoration de 1'ADNc codant 
pour chacune des dix chames prot6iques constituant la mol6cule d'hemoglobine 
d'Arenicola marina, de 4 minutes a une temp6rature egale a 95°C, 

- le cycle, repete 35 fois, comprend les etapes suivantes : 

* une 6tape de denaturation de l'ADNc codant pour chacune des dix chaines 
proteiques constituant la molecule d'hemoglobine d'Arenicola marina, de 
30 secondes a une temperature egale a 95°C, 

* une 6tape d'hybridation des couples d'amorces de l'invention aux brins 
d'ADNc monocatenaires susmentionnes pout? obtenir des amorces 
hybridees, de 30 secondes a une temperature egale a 52°C, 

* une 6tape d'elongation des amorces hybridees telles qu'obtenues 
precedemment par une polymerase de 40 secondes a une temperature egale 
a72°C,et 

- la demiere etape du procede est une etape d'61ongation des amorces hybridees 
telles qu'obtenues precedemment par une polymerase de 10 minutes a une 
temperature egale a 72°C, 

afin d'obtenir la sequence nucleotidique SEQ ID NO : 3. 
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La sequence nucleotidique SEQIDNO:3 est une nouvelle sequence 
nucteotidique codant pour une chaine proteique correspondant a une chatne de globine, 

notee A2 (b): SEQ ID NO : 3- comprend -288 nucleotides; 

Un proc6de de preparation particulierement avantageux selon l'invention est un 
proc6d6 de preparation tel que d6fini ci-dessus, caracterise en ce -que le couple 
d'amorces utiliseest Ie suivant :(aar gti aar can arc tgg ; cca-ngc ncc HM? 
-^cT<A7i)rRrl7^" e ^ 



ledit precede etant caracterise en ce que : 

- la premiere etape du precede est une etape de denaturation de l'ADNc codant 
pour chacune des dix chames proteiques constituant la molecule d'hemoglobine 
d'Arenicola marina, de 4 minutes a une temperature 6gale a 95°C, 

- le cycle, repete 35 fois, comprend les 6tapes suivantes : 

* une etape de denaturation de l'ADNc codant pour chacune des dix chaines 
proteiques constituant la molecule d'hemoglobine VArenicola marina, de 1 
minute a une temperature egale a 95°C, 

* une etape d'hybridation des couples d'amorces de l'invention aux brins 
d'ADNc monocatenaires susmentionnes pour obtenir des amorces 
hybridees, de 1 minute a une temp6rature 6gale a 50°C, 

* une etape d'elongation des amorces hybridees telles qu'obtenues 
precedemment par une polymerase de 1 minute et 30 secondes a une 
temperature egale a72°C, et 

- la derniere etape du proced6 est une etape d'elongation des amorces hybridees 
telles qu'obtenues prec6demment par une polymerase de 10 minutes a une 
temperature egale a 72°C, f 

afin d'obtenir la sequence nucl6otidique SEQ ID NO : 5. 

La sequence nucleotidique SEQ ID NO: 5 est une nouvelle sequence 
nucleotidique codant pour une chaine prot6ique correspondant a une chaine de globine, 
notee Al. SEQ ID NO : 5 comprend 360 nucleotides. 

Un precede de preparation particulierement avantageux selon l'invention est un 
precede de preparation tel que defini ci-dessus, caracteris6 en ce que le couple 
d'amorces utilise est le suivant :(tgy tgy agy ath gar gay cg ; ca ngc nyc rct 
rtt raa RCA), Y, H, R et N etant tels que dermis ci-dessus, 
ledit precede etant caracteris6 en ce que : 
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- la premiere etape du precede est une etape de demturation de l'ADNc codant 
pour chacune des dix chaines proteiques constituant la molecule d'hemoglobine 
d'Arenicola marina, de 4 minutes a une temperature egale a 95°C, 

- le cycle, repete 35 fois, comprend les etapes suivantes : 

* une 6tape de denaturation de l'ADNc codant pour chacune des dix chaines 
proteiques constituant la molecule d'hemoglobine VArenicola marina, de 
30 secondes a une temperature 6gale a 95°C, 

* une etape d'hybridation des couples d'amorces de l'invention aux brins 
d'ADNc monocatenaires susmentionnes pour obtenir. des amorces 
hybridees, de 40 secondes a une temperature egale a 52°C, 

* une etape d'elongation des amorces hybridees telles qu'obtenues 
precedemment par une polymerase de 30 secondes a une temperature egale 
a 72°C, et 

- la derniere etape du procede est une etape d'elongation des amorces hybridees 
telles qu'obtenues precedemment par une polymerase de 10 minutes a une , 
temperature egale a. 72°C, 

afin d'obtenir la sequence nucl6otidique SEQ ID NO : 7. 

La sequence nucleotidique SEQ ID NO: 7 est une nouvelle sequence 
nucleotidique codant pour une chafne proteique correspondant a une chaine de globine, 
notee B2. SEQ ID NO : 7 comprend 390 nucleotides. 

La pr6sente invention concerne 6galement des prot6ines cod6es par l'une des 
sequences telles qu'obtenues selon le procede tel que defini ci-dessus. 

Une proteine preferee selon l'invention est une proteine telle que deflnie ci- 
dessus, caracterisee en ce qu'eUe comprend ou est constituee par : 

- la sequence SEQ ID NO: 2, 

- ou toute sequence d6rivee de la sequence SEQ ID NO : 2 ou d'un fragment 
defini ci-dessous, notamment par substitution, suppression ou addition d'un ou plusieurs 
acides amines, sous reserve que ladite sequence d6rivee pennette le transport de 
1'oxygene, 

- ou toute sequence homologue de la sequence SEQ ID NO : 2 ou d'un fragment 
d6fini ci-dessous, ayant de preference une homologie d'au moins environ 75%, 
notamment d'au moins environ 85%, avec la sequence SEQ ID NO : 2, sous reserve que 
ladite sequence homologue pennette le transport de 1'oxygene, 
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- ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de l'oxygene, notamment tout fragment etant constitue 
d'au moins environ-60 acides amines, et notamment - d^au- moins environ- 160 acides— 
amines contigus dans la sequence SEQ ID NO : 2. 

La sequence SEQ ID NO : 2 est une nouvelle s6quence proteique correspondant a 
unecbaine de globine, notee A2 (a). 

-Les^roprietes^e-tran^^ — 



peuvent etre notamment verifiees en mesurant leur spectre d'absorption par 
spectrophotometrie typique de l'oxyhemoglobine. 

Une proteine preferee selon l'invention est une proteine telle que definie ci- 
dessus, caracterisee en ce qu'elle comprend ou est constituee par : 

- la sequence SEQ ID NO : 4, 

- ou toute sequence derivee de la sequence SEQ ID NO : 4 ou d'un fragment 
defini ci-dessous, notamment par substitution, suppression ou addition d'un ou plusieurs 
acides amin6s, sous r6serve sous reserve que ladite sequence derivee permette le 

transport de l'oxygene, 

- ou toute sequence homologue de la sequence SEQ ID NO : 4 ou d'un fragment 
defini ci-dessous, ayant de preference une homologie d'au moins environ 75%, 
notamment d'au moins environ 85%, avec la sequence SEQ ID NO : 4, sous reserve que 
ladite sequence nomologue permette le transport de l'oxygene, 

- ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de l'oxygene, notamment tout fragment etant constitue 
d'au moins environ 60 acides amines, et notamment d'au moins environ 160 acides 

" amines contigus dans la sequence SEQ ID NO : 4. f 

La sequence SEQ ID NO : 4 est une nouvelle s6quence prot6ique correspondant a 
une chaine de globine, notee A2 (b). 

Une proteine preferee selon l'invention est une proteine telle que definie ci- 
dessus, caracterisee en ce qu'elle comprend ou est constituee par : 

- la sequence SEQ ID NO : 6, 

- ou toute sequence derivee de la sequence SEQ ID NO : 6 ou d'un fragment 
defini ci-dessous, notamment par substitution, suppression ou addition d'un ou plusieurs 
acides amines, sous reserve sous reserve que ladite sequence deriv6e permette le 
transport de l'oxygene, 
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- cm toute sequence homologue de la sequence SEQ ID NO : 6 ou d'un fragment 
defini ci-dessous; ayant de preference une homologie d'au moins environ 75%, 
notamment d'au moins environ 85%, avec la sequence SEQ .ID NO : 6, sous reserve que 
ladite sequence homologue permette le transport de l'oxygene, 

- ou tout fragment d'une des sequences d6finies ci-dessus, sous reserve que ledit 
fragment permette le transport de l'oxygene, notamment tout fragment etant constitue 
d'au moins environ 60 acides amines, et notamment d'au moins environ 160 acides 
amines contigus dans la sequence SEQ ID NO : 6. 

La sequence SEQ ID NO : 6 est une nouvelle sequence proteique correspondant k 

une chaine de globine, notee Al . 

Une protdine prefer6e selon l'invention est une proteine telle que definie ci- 
dessus, caracterisee en ce qu'elle comprend ou est constitu6e par : 

- la sequence SEQ ID NO: 8, 

_ ou toute s6quence derivee de la sequence SEQ ID NO : 8 ou d'un fragment . , 
d6fini ci-dessous, notamment par substitution, suppression ou addition d'un ou plusieurs 
acides amines, sous reserve que ladite sequence deriv6e permette le transport de 
l'oxygene, 

- ou toute s6quence homologue de la sequence SEQ ID NO : 8 ou d'un fragment 
d6fini ci-dessous, ayant de preference une homologie d'au moins environ 75%, 
notamment d'au moins environ 85%, avec la sequence SEQ ID NO : 8, sous reserve que 
ladite sequence homologue permette le transport de l'oxygene, 

- ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de l'oxygene, notamment tout fragment etant constitue 
d'au moins environ 60 acides amin6s, et notamment d'au moins environ 160 acides 
amines contigus dans la sequence SEQ ID NO : 8. 

La sequence SEQ ID NO : 8 est une nouvelle s6quence proteique correspondant a 

une chaine de globine, notee B2. 

La presente invention concerne egalement des sequences nucleotidiques telles 

qu'obtenues selon le proc6de tel que defini ci-dessus. 

La presente invention concerne egalement des sequences nucleotidiques codant 
pour une proteine telle que d6finie ci-dessus. 

La presente invention concerne 6galement une sequence nucleotidique telle que 
definie ci-dessus, caracterisee en ce qu'elle comprend ou est constitii6e par : 

- la sequence nucleotidique SEQ ID NO : 1 codant pour SEQ ID NO : 2, 
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- ou toute sequence nucleotidique derivee, par degenerescence du code 
genetique, de la sequence SEQ ID NO : 1, et codant pour une proteine representee par 
SEQ" ID NO : 2, — ■ " ' 

- ou toute sequence nucleotidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 1 
codant pour une proteine derivee de SEQ ID NO : 2, 

~6u "Eoufe sequence nucleotidi^ue^bmbTogue " SEQ' ID NO : 1, ayant de 

preference une homologie d'au moins environ 60%, avec la sequence SEQ ID NO : 1, 

- ou tout fragment de la sequence nucleotidique SEQ ED NO : 1 ou des 
sequences nucleotidiques definies ci-dessus, ledit fragment etant de preference constitue 
d'au moins environ 180 nucleotides, et notamment d'au moins environ 480 nucleotides 
contigus dans ladite sequence, 

- ou toute sequence nucleotidique complementaire des sequences ou fragments 
susmentionnes, 

- ou toute sequence nucleotidique susceptible d'kybrider dans des conditions 
stringentes avec la sequence complementaire d'une des sequences ou d'un des 
fragments susmentionn6s. 

Les conditions de stringence correspondent a des gammes de temperatures 
comprises entre 48 et 60°C et de concentrations en MgCl 2 comprises entre 1 et 3 mM. 

La presente invention concerne egalement une sequence nucleotidique telle que 
definie ci-dessus, caracterisee en ce qu'elle comprend ou est constituee par : 

- la sequence nucleotidique SEQ ID NO : 3 codant pour SEQ ID NO : 4, 

- ou toute sequence nucleotidique derivee, par degenerescence du code 
genetique, de la sequence SEQ ID NO : 3, et codant pour una proteine representee par 
SEQ ID NO: 4, 

- ou toute sequence nucleotidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 3 
codant pour une proteine derivee de SEQ ID NO : 4, 

- ou toute s6quence nucleotidique homologue de SEQ ID NO : 3, ayant de 
preference une homologie d'au moins environ 60%, avec la sequence SEQ ID NO : 3, 

- ou tout fragment de la sequence nucleotidique SEQ ID NO : 3 ou des 
sequences nucleotidiques definies ci-dessus, ledit fragment etant de preference constitue 
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d'au moins environ 180 nucleotides, et notamment d'au moms environ 480 nucleotides 

contigus dans ladite sequence, 

_ ou toute sequence nucl6otidique complementaire des sequences ou fragments 

susmentionnes, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'une des sequences ou d'un des 

fragments susmentionnes. 

La presente invention conceme 6galement une sequence nucleotidique telle que . 
ddfinie ci-dessus, caract6risee en ce qu'elle comprend ou est constituee par : 

- la sequence nucleotidique SEQ ID NO : 5 codant pour SEQ ED NO : 6, 

- ou toute sequence nucleotidique deriv6e, par degen6rescence du code 
genetique, de la sequence SEQ ID NO : 5, et codant pour une proteine representee par 
SEQ ID NO: 6, 

_ ou toute sequence nucl6otidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 5 
codant pour une proteine d6riv6e de SEQ ID NO : 6, 

- ou toute sequence nuc!6otidique homologue de SEQ ID NO : 5, ayant de 
preference une homologie d'au moins environ 60%, avec la sequence SEQ ID NO : 5, 
~ - ou tout fragment de la sequence nucleotidique SEQ ID NO : 5 ou des 
sequences nucleotidiques d6finies ci-dessus, ledit fragment tat de preference constitue 
d'au moins environ 180 nucleotides, et notamment d'au moins environ 480 nucl6otides 

contigus dans ladite sequence, 

- ou toute s6quence nucleotidique complementaire des sequences ou fragments 

susmentionnes, ' 

_ ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 

stringentes avec la sequence complementaire d'une des sequences ou d'un des 

fragments susmentionn6s. 

La presente invention conceme egalement une sequence nucleotidique telle que 

definie ci-dessus, caract6risee en ce qu'elle comprend ou est constituee par : 
- la sequence nucleotidique SEQ ID NO : 7 codant pour SEQ ID NO : 8, 
_ ou toute sequence nucleotidique derivee, par d6generescence du code 

genetique, de la sequence SEQ ID NO : 7, et codant pour une proteine representee par 

SEQ ID NO: 8, 
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- ou toute sequence nucleotidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 7 
codanTp^uruiie'pfoteiiiederivee de SEQ "ID "NO": 8," 

^.ou toute sequence nucleotidique homologue de SEQ ID NO : 7, ayant de 
preference une homologie d'au moins environ 60%, avec la sequence SEQ ID NO : 7, 

- ou tout fragment" de la sequence "nucleotidique SEQ ID NO : 7 ou des 

-sequenc^ucleo^drqu^ 
d'au moins environ 180 nucleotides, et notamment d'au moins environ 480 nucl6otides 
contigus dans ladite sequence, 

- ou toute sequence nucleotidique complementaire des sequences ou fragments 

susmentionnes, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la s6quence complementaire d'une des sequences ou d'un des 
fragments susmentionnes. 

Lapresente invention concerne un proced6 de preparation tel que defini ci-dessus, 
de sequences nucleotidiques codantpour les chaines proteiques constituent la molecule 
d'hemoglobine d'Annelides, notamment d'Arenicola tnarina, ledit precede etant 
caracterise en ce qu'il comprend les etapes suivantes : 

- une etape de mise en pr6sence de la molecule d'hemoglobine susmentionnee 
avec au moins un agent dissociant, notamment un melange constitue de dithiothreitol 
(DTT) ou de chlorhydrate de tris(2-carboxyetbyl)phosphine (TCEP) ou de beta- 
mercaptoethanol et d'un tampon de dissociation, pendant un temps sufflsant pour 
separer les chaines proteiques les unes des autres, 

permettant la dissociation de ladite mol6cule d'hemoglobine, afin d'obtenir les dix 
chaines proteiques constituant ladite molecule, 

- l'isolement de chacune des dix chaines proteiques susmentionnees, 

- le microsequencage de chacune des dix chaines proteiques isolees 
susmentionn6es par spectrom6trie de masse, afin d'obtenir une microsequence 
correspondant a chacune des dix sequences constituees de 5 a 20 acides amines, 

- la determination des dix couples d' amorces degener6es (sens et antisens) a 
partir des microsequences susmentionnees, 

- la preparation des sequences nucl6otidiques codant pour les chames proteiques 
susmentionn6es, a partir des amorces telles qu'obtenues prec6demment > par un precede 
d'amplification en chalne par polymerase (PCR), comprenant les etapes suivantes : 
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- la premiere etape dudit precede est une etape de d6naturation de l'ADNc 
codant pour chacune des dix chaines proteiques constituant la molecule 
d'hemoglobine SArenicola marina, d'environ 10 secondes a environ 5 minutes a 
une temperature comprise d'environ 90°C a environ 110°C, 

- le cycle, repet6 environ 30 a 40 fois, comprend les etapes suivantes : 

* une etape de denaturation de l'ADNc codant pour chacune des dix chaines 
proteiques constituant la molecule d'hemoglobine VArenicola marina, 
d'environ 10 secondes a environ 5 minutes, a une temperature comprise 
d'environ 90°C a environ 110°C, 

* une etape d'hybridation des couples d'amorces de l'invention aux brins 
d'ADNc monocat6naires susmentionnes pour obtenir des amorces 
hybrid6es, d'environ 20 secondes a environ 2 minutes, a une temperature 
comprise d'environ 50°C a environ 56°C, 

* une etape d'elongation des amorces hybrid6es telles qu'obtenues 
precedemment par une polymerase d'environ 20 secondes a environ 1 
minute et 30 secondes, a une temperature comprise d'environ 70°C a 
environ 75°C, et 

- la derniere 6tape du proced6 est une etape d'aongation des amorces hybridees 
telles qu'obtenues precedemment par une polymerase d'environ 5 minutes a environ 
1 5 minutes a une temperature comprise d'environ 70°C a environ 75°C. 
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DESCRIPTION PES FIGURES 

La Figure 1 represente un chromatogramme de Phemoglobine. de . Arenicola 
marina sur colonne Superose 12-C. La courbe superieure correspond a une absorbance 
de 414 nm' ef la courbe infeneur e k une absorbance "de 280 run. (Le collecteur est 
— programme-pour-eolleeter-en^ 

La Figure 2 represente le spectre UV de Themoglobine de Arenicola marina 
fonctionnelle (sons sa forme oxyh6moglobine). 

La Figure 3 represente le chromatogramme (a 414 nm) de l'HbAm dissociee 
(partiellement) obtenu sur Superose 12-C et les traits verticaux sur le chromatogramme 
correspondent aux fenetres de collecte (correspondant a la recuperation des sous-unites). 

La Figure 4 repr6sente un gel SDS-PAGE obtenu pour les differentes fractions 
collectees. 

La Figure 5 represente le chromatogramme (a 414 nm) de THbAm dissociee 
(partiellement) obtenu sur CIM DISK DEAE (systeme d'echange anionique) et les traits 
verticaux sur le chromatogramme correspondent aux fenetres de collecte. La courbe en 
pointilles indique le gradient. 

La Figure 6 represente un gel SDS-PAGE obtenu pour les differentes fractions 
collectees. 

La Figure 7 represente la cinetique de dissociation de 1'HbAm en presence d'uree 
3M. L'axe des abscisses correspond au nonibre de jours et Taxe des ordonnees 
coirespond au pourcentage de dissociation de la molecule native ; la courbe en pointilles 
correspond au dodecamere ; la courbe avec les carres noirs au trimere et au "linker 11 
(chaine de structure) ; la courbe avec les ronds noirs aux monomeres. 

La Figure 8 represente la cinetique de dissociation de THbAm a pH 1 0. L'axe des 
abscisses correspond au nombre de jours et Taxe des ordonnees coirespond au 
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pourcentage de dissociation de la molecule native ; la courbe en pointilles correspond au 
dodecamere ; la courbe avec les carres noirs au trimere et au "linker" ; la courbe avec 
les ronds noirs aux monomeres. 

La Figure 9 represente la cinetique de dissociation de l'Hb Am en presence d'uree 
3M a pH 10. L'axe des abscisses correspond au norabre de jours et l'axe des ordonnees 
correspond au pourcentage de dissociation de la molecule native ; la courbe en pointiU6s 
correspond au dodecamere ; la courbe avec les carres noirs au trimere et au "linker" ; la 
courbe avec les ronds noirs aux monomeres. 

La Figure 10 reprdsente le suivi de la cinetique de reassociation a partir du 
pourcentage d'HbAm (HBL) et de Dodecamere (D) et selon la technique de 
changement de tampon (Centricon ou Dialyse). L'axe des abscisses correspond • au 
nombre de jours et l'axe des ordonnees correspond au pourcentage de dissociation de la 
mol6cule native avec la technique Centricon ; la courbe en traits P ointill6s correspond a 
HBL avec la technique de dialyse ; la courbe avec les triangles noirs correspond au 

dodecamere avec la technique Centricon; la courbe en trait plein correspond au 

dodecamere avec la technique de dialyse. 

La Fimire 11 represente la superposition des chromatogrammes de 
chromatographic d'exclusion au cours de la ^association correspondant a differents 
temps de reassociation. 

La Figure 12 represente le cbromatogramme HPLC obtenu avec les fenetres de 
collecte (Haite verticaux). Les masses indiqu6es ont ete determinees par spectrometrie 
de masse (ESI-TOF). Les codes (62, al , b3, dl, c) correspondent aux noms des globmes 
telles que mentionnees dans rarticle de Zal et al. (1997). 
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P ARTIE EXPERIMENT ALE 

--La-pr&entehivention-a^ 
du polychete marin Arenicola marina (HbAm) comme substitut sanguin chez des 
vertebres. Cependant, meme si ce ver represente une biomasse importante, la synthese 
par genie genetique s'avere une voie indispensable et necessaire. II est done primordial 
-d'eradier-les-proprietes-d-^ 
hemoglobine artificielle, fonctionnelle et stable. Les protocoles de dissociations ainsi 
que les techniques de purification de chaque sous-unit6 et chalne poiypeptidique sont 
developpees en detail ci-apres, de meme que les premieres approches de reassociation. 



Extraction et purification de Ph€moglobme 

1) Rs pece etudi6e : Arenicola marina ; Ann61ide de l'ecosysteme intertidal 
L'Ann61ide Polychete Arenicola marina est une espece sedentaire tres repandue 
sur toutes les cotes de 1' Atlantique Nord, de la mer Noire et de PAdriatique situees au- 
dessus du quarantieme parallele. Dans la region de Roscoff, l 5 Arenicole, communement 
appel6e "ver du pScheur" constitue des populations denses. Le sediment habite par ces 
populations presente une surface irreguliere alternant bosses et creux formes 
respectivement par des monticules de dejections et des depressions coniques. 
L' Arenicole vit dans des galeries amenagees dans le sable. La structure de la galerie se 
pr6sente sous forme de U, avec une branche ouverte sur l'exterieur, l'autre etant fermee. 
V Arenicole est log6e dans la partie horizontale, son extremity cephalique orientee vers 
la partie aveugle. Elle ingere le sable, en extrait la matiere organique assimilable et 
defeque ensuite par son extremite caudale, formant ainsi des monticules de tortillons de 
sable. A l'interieur de l'etage mediolittoral, la repartition et la densite des peuplements 
sont essentieUement commandees par la granulomere, la concentration en matiere 
organique et la salinite. 

L' Arenicole, vivant surtout dans les zones de balancement des marees, est amenee 
a subir des variations de pression d'oxygene. Sa galerie lui permet d'etre en contact 
permanent avec 1' eau de mer (riche en oxygene), pendant la maree basse. 
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2) Methodes d' etude 

2.1. Prelevement du materiel biologique 

Les animaux sont recoltes a maree basse, dans la baie de Penpoull, pres de 
Roscoff (France) et maintenus dans l'eau de mer une nuit afin de vider leur tube 
digestif. Les prelevements de sang sont effectues a i'aide d'une seringue au niveau du 
vaisseau dorsal. Les echantillons sont collects sur de la glace et filtres sur de la laine de 
verre. Apres une centrifugation a froid (15 000 g pendant 15 min a 4°C) pour eviter la 
dissociation des molecules et pour eliminer les debris tissulaires, les surnageants sont 
concentres au moyen d'une cellule Amicon (Millipore) et d'une membrane de "cut-off 
de 500 kDa (ne sont retenues que les masses superieures a 500 kDa). 

2.2. Purification des hemoglobines 

Une fois le sang concentr6, une filtration basse pression (FPLC) par exclusion 
(separation en fonction de la taille de la molecule: plus la molecule est de taille 
importante plus elle est eluee rapidement) est effectu6e sur colonne (100 * 3 cm) de gel 
Sephacryl S-400 (Amersham)(gamme de separation comprise entre 20 x 10 3 et 8000 * 
10 3 ), en chambre froide (4°C). Chaque purification est effectu6e sur 5 mL d'echantillon, 
elues avec le tampon sale Arenicola marina (10 mM Hepes ; 4 mM KC1 ; 145 mM 
NaCl ; 0,2 mM MgCl 2 ajuste a pH 7,5 avec de l'acide chlorhydrique). Le debit utilise 
pour cette premiere purification est de 40 tr/min et ne sont recuperees que les fractions 
les plus rouges (contenant de l'heme). Ces fractions sont ensuite concentrees a Faide de 
tube Centricon-lOkDa retenant les molecules d'un poids superieur ou egal a 10000 Da. 

Une deuxi&ne purification est ensuite effectu6e par filtration basse pression 
(Systeme HPLC, Waters) d'aliquot de 200 uL sur une colonne 1 * 30 cm Superose 
12-C (Pharmacia, gamme de separation comprise entre 5 x 10 3 et 3 x 10 Da) a 
temp6rature ambiante. Le d6bit utiHse est de 0,5 ml/min. Les echantillons sont 
conserves a 4°C et recolt6s dans de la glace. L'absorbance de l'61uat est suivie a deux 
longueurs d'ondes : 280 nm (pic d'absorbance des proteines) et 414 nm (pic 
d'absorbance de l'hemoglobine). Les fractions contenant de l'heme sont isolees grace 
au collecteur (programmd sur une fenetre de temps correspondant au temps de retention 
de l'hemoglobine)(Figure 1). Les echantillons sont concentres, doses, puis stockes a 
-40°C avant utilisation. 



1er depot 



24 



2.3. Dosage des hemoglobines 

Le reactif de Drabkin (Sigma), utilise pour le dosage, permet de determiner la 
quantite en htme de la solution: t'htoglobme reagit wee le reactif de DfabMn lequel 
contient du potassium de ferricyanure, du cyanure de potassium et du bicarbonate de 
sodium. L'hemoglobine est transformee en methemoglobine par Taction du 
ferricyanure. Les methemogiobines reagissent ensuite avec le cyanure pour former le 
-cyanmethemc^tob^ 



quantite d'heme dans la solution. Or, l'hemoglobine extracellulaire de Arenicola marina 
(HBL) contient en moyenne 1 mol d'heme pour 23 000 g de proteine, ce qui permet par 
un calcul simple, d'obtenir la concentration en HBL de chaque echantillon. 

3) Resultats 

Ainsi, 800 mg d'hemoglobine extracellulaire de Arenicola manna ont ete purifies. 
Chaque lot (aliquots de lmL) est analyse par FPLC sur colonne Superose 
12-C (Pharmacia) afin de s' assurer de la purete de I'echantillon (un pic unique). De 
meme un spectre UV sur une plage de 400 nm a 700 nm est r6alis6 pour verifier la 
fonctionnalite des h6moglobines de chaque lot (Figure 2). On observe deux maximums 
d'absorption a 541 et 577 nm. Par comparison, on rappelle que la methemoglobine 
presente un maximum a 540 nm. 

Enfin, ces lots sont utilises par la societe Biotrial S.A. (Rennes, France) pour etre 
transfus6s a des souris et tester les eventuelles factions pathologiques et immunogenes. 



nu^Hfltinn de l'hemoglobine ex t racellulaire de Arenicola marina en c( 
rtifttrentes sous-unites de bas e fTrimeres. Dimeres de linker et Monomeres) 

La dissociation de l'hemoglobine extracellulaire A' Arenicola marina (HbAm) dc 
Stre totale et conserver les sous-unites fonctionnelles. Les differentes sous-unit6s so 
ensuite isol6es et analysees par des techniques de chromatographie liquide (exclusion 
echange d'ions), developpees a cet effet. 
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1) Dissociation de PHBL 
1.1. Technique de dissociation 

Les etudes preliminaires de dissociation ont ete developpees a partir des 
publications de l'art anterieur (Vinogradov et aL, 1979; Sharma et aL, 1996; 
Mainwaring et aL, 1986 ; Polidori et aL, 1984 ; Kapp et aL, 1984 ; Chiancone et aL, 
1972 ; Vinogradov et aL, 1991 ; Krebs et aL, 1996), c'est-a-dire en presence d'un reactif 
dissociant unique : uree, ions h6teropolytungstate ou ions hydroxydes. Les trois agents 
utilises agissent differeniment sur la molecule : 

- les ions hydroxydes (OH") destabilised les ponts salins 

- I'ur6e destabilise les interactions hydrophobes 

- 1'action des ions polytunsgtate n'est pas encore bien connue mais ils 
interagissent sur les interactions electrostatiques. 

Or, l'interet est d'obtenir le plus rapidement et le plus efficacement possible- les 
quatre sous-unit6s de bases d'ou l'idee d'associer les differents agents dissociants et en 
particulier le pH alcalin et Puree. Apres differents tests, il severe qu'une dissociation 
rapide et efficace est obtenue avec de l'uree 3M dilue dans le tampon de dissociation 
(0,1 M de base Trisma et ImM d'EDTA) ajuste a pH 10 avec de la sonde 2N, L'HbAm 
est ajustee a une concentration d'environ 4 mg/mL (solution mere). Toutes les .analyses 
sont effectu6es a +4°C et les echantillons sont consents a l'obscurite le temps de 
l'6tude. (Trisma = tris[hydroxymethyl]aminomethane) 



1 .2. Analyses par chromatographic d' exclusion 

Les conditions d' analyses sont detaillees dans le tableau 1 ci-dessous. 



Systeme HPLC 
Coloivne 


HPLC Waters 626 LC System 
~ Superose 12-C (Pharmacia) 
(gamme de separation comprise entre 5x10* et 3x10 s Da) 
0.5mL/min 


Debit 
Eluant 


tampon de dissociation ate plus haut 
ajuste k pH 7,0 avec de 1'acide chlorhydrique 
concentre et nitre sur filtre 0,45um 


Temperature 
de rinfecteur 


+ 4°C 




Ed 

Suivi Analytique 


hantillon 

Separation et collecte 
200uL 


Volume injects 

Preparation 
des echantillons 


20uL 

Solution m&re diluee k Img/mL 
dans le tampon de dissociation k 
pHlQ et filtree sur 0,45Mm 


Solution m^re £iltr6e sur filtre 0,45*im 
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1.3. Analyses pax echange d'ions 
- - Le point isoelectrique<pHi) de I'HBL etant de 4,69-(Vinogradov 5 1 98 5); l 5 analyse 
par echange d'ions est realisee sur une colonne anionique CIM DEAE disk.(Merchim). 
En effet, L'HBL est chargee negativement pour un pH superieur au pHi et est done 
fixee sur une resine chargee positivement (resine DEAE). L'elution est effectuee grace a 
4a--foree4onique-avee-un gradientnonlmeaire- deNaC! de 0-a~l"M-(solutiw derNaClite" " 
1 M diluee dans le tampon de dissociation a pH 7,0 et filtree sur 0,45 |xm). Le tampon 
de dissociation a pH 7 est utilis6 comme tampon d'elution. Le debit est de 4 mL/min. 

2) Resultats 

2.1. Chromatographie d 5 exclusion 

Le chromatogramme de 1'HbAm dissociee en partie, est represents figure 3, Cinq 
pics sont observes et il s'agit de les identifier. Les molecules sont eluees selon leur 
masse decroissante et 1'HbAm native sort dans le volume mort (16 min). Les fractions 
correspondant a chaque pic sont analysdes par SDS-PAGE (figure 4). Les resultats sont 
presentes dans le tableau 2 ci-dessous. 



Fractions 


Temps de retention 


Sous-unit6s 


1 


16 min 40 


HbAm native 


2 


22 min 20 


Dod6camere 


3 


25 min 30 


Dimere de linker 


4 


26 min 40 


Trimere 


5 


28 min 30 


Monopaeres 



2.2. Chromatographie ionique 

Une fois la methode developpee (tableau 3), les fractions sont collectees, 
concentrees et analysees par gel SDS afin (identifier chaque pic (Fig. 6 et tableau 4). 
Une methode est ensuite developpee pour repurifier chaque sous-unite. 
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Temps 
en rain 


AtlMNaCl 
dans B 


B : Tampon de 
dissociation pH 7.0 


0 


5% 


95% 


0,5 


15% 


85% 


1,5 


15% 


85% 


2,5 


22% 


78% 


3,5 


22% 


78% 


3,6 , 


25% 


75% 


5,5 


25% 


75% 


5,6 


29% 


71% 


6,5 


29% 


71 % 


6,6 


36% 


64% 


7,0 


36% 


64 % 


8,0 


45% 


55% 


8,1 


100% 


0% 


1 9,5 


100% 


0% 



TABLEAU 3 : Methode dSveloppee pour 1' analyse de PHBL dissoci6e sur CIM-DEAE 



fractions 



Temps de 
retention 



1 min. 15 



2 min 40 



3 min 10 



Sous-unites 



Monomeres 



Dimere de linker 
Dimere de linker 



6 



4 min 40 



Dodecarnere 



6 min 30 

7 min 30 



Trimere 



8 min 50 



HbAm 



TABLEAU 4 : Association r6alisee apres 
analyse du gel (Figure 6) entre le temps de 
retention et les sous-unites. 

{ 



10 2.3. Dissociation de I'Hb Am 

La cinetique de dissociation est suivie par chromatographic d'exclusion. 
L'integration des chromatogrammes par le logiciel Millenium (Waters), permet le calcul 
du pourcentage des differents compost a partir de I s aire sous courbe. L^volution de la 
cinetique de dissociation est representee figures 7, 8 et 9. 
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Les trois graphiques des Figures 7, 8 et 9 montrent bien Tinteret d'associer les 
deux agents dissociants (uree 3M et OHT) pour obtenir efficacement les trois sous-unites 
-debase en 24h.- — - - " 

Reassociation de Phemoglobine 



1) Materiels et methodes 

Les experiences de reassociation sont effectuees sur PHbAm dissociee selon les 
protocoles cites plus haut (pH9, pHIO, Uree 3M, Uree 4M, Uree 3M a pHIO). 
Differents tampons de reassociation sont testes afin d' obtenir une reassociation 
optimale. Le changement de tampon (tampon de dissociation -> tampon de 
reassociation) est effectue de deux fa?on differentes pour tester la "meilleure" technique 
de remplacement de tampon : 

- L'HbAm dissociee est lavee 4 fois contre 4 mL de tampon de reassociation sur 
Centricon-10 (Millipore) a +4°C ; 

- L'HbAm dissociee est dialysee 24 h contre de 1'eau MilliQ (Millipore) (2 x 
2L) puis 48 h contre le tampon de reassociation (3 * 2L) k +4°C 

2) Resultats 

D'apres des resultats ulterieurs sur les hemoglobines extracellulaires d'Annelides 
(Mainwaring et al., 1986 ; Polidori et al., 1984), la presence d'ions divalents tels que 
Ca 2+ et Mg 2+ est necessaire au maintien de la structure quaternaire de 1'hemoglobine. En 
effet, ils la stabilisent et ralentissent le phenomene de dissociation (Sharma et al., 1996). 
Ces ions ferment un complexe avec les groupes carboxylates des chaines laterales et 
carbonyles des chaines principals. La presence d'ions divalents peut avoir un effet sur 
la reassociation lorsque les groupements carboxyliques sont ionises, done entre autre 
lorsque la dissociation a eu lieu k pH alcalin. H est done important que le tampon de 
^association contienne du calcium et/ou du magnesium. Ceci explique aussi la presence 
d'EDTA dans le tampon de dissociation ; EDTA qui chelate ces ions divalents. Le 
tampon actuellement mis au point est constitue de 0,1 M de base Trisma, 10 mM de 
CaCl 2 et 10 mM de MgCl 2 ajuste a pH 7 avec de THC1 concentr6. La reassociation est 
suivie selon le meme principe que la dissociation (Figures 10 et 1 1). 
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Un debut de reassociation est observe apres 15 jours et 40% de 1'HbAm sont 
reassocies apres 45 jours dans le tampon de reassociation. 

T3^,,rtinn de 1'HbAm pour l'etude des differentes chaines polypeptidiques 



1) Pftdnction de l'hemoglobine 

L'HbAm (4 mg/mL) est reduite dans 100 mM de DTT (dithiothreitol) dissout 
dans le tampon de dissociation a pH 8-9 pendant 1 h a 40°C. Dans ces conditions 
drastiques, seules les globines pourront etre analysees. En effet, les linkers (proteines. 
non-globines) sont riches en cysteines et sont done deteriores. Une fois r6duite, 1'HbAm 
est lavee 4 fois sur Amicon 30 OOODa (Millipore) dont seul le filtrat est recupere (tout 
ce qui est de poids inferieur a 30 000 Da). Le filtrat est ensuite lave sur Amicon 
10 OOODa pour eliminer tout ce qui est inferieur a 10 000 Da. Ainsi, seals les 
monomeres compris entre 30 000 Da et 10 000 Da sont contenus dans l'echantillon 
(gamme de poids des chaines de globines qui constituent 1'HbAm). 

2) Purification des plobines par r.hrnmatographie de phase inverse 
2.1. Materiels et methodes 

La chromatographic par phase inverse est effectu6e sur une colonne de Symmetry 
300 Ci8 Sum (4,6 x 250 mm) de chez Waters. La methode developpee est decrite dans, 
le tableau ci-dessous et le chromatogramme obtenu est represent6 figure 12. 



da>it 


1 mL/min ■ 


Eluant A 


H,0 MilliQ + 0.1% v/v TFA 


"P-luant B 


ACN + 0.1%v/vTFA 


Gradient 


Temps en min 


% A 


%B 


0 


80 


20 


0,25 


60 


40 


r~ 4,0 


• 55 


1 45 


10,0 


55 


45 


10,05 


0 


100 


16,0 


0 


100 
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3) Analyse par micro sequenpage des globines isolees 

Les chaines de globines isolees sont microsequencees par spectrometrie de masse 
afin-d^obtenir- des informations de sequences pour Tealiser" des amorces ~6u pour" 
completer les sequences prealablement determinees en biologie moleculaire. - - 

D&ails^es-protocolesd^mplifi^ 

des globines des sous-families Al, A2a, A2b et B2 du polychete marin Arenicola 
marina 

Les amplifications par PCR des 4 globines Al, A2a, A2b et B2, dont les 
sequences nucleotidiques sont presentees ci-dessous, ont debute par la conception 
d'amorces d6generees specifiques (sens et antisens) des sous- families Al, A2 et B2. Ces 
amorces ont ete conges a partir d'alignements de sequences proteiques de globines 
d ! annelides disponibles dans les banques de donnees. 

Preparation des mierosequences par MSMS (Separation des proteines sur gel 2D) 
Electrofocalisation 

Apres purification par FPLC, 1'hemoglobine de Arenicola est dialysee et 
lyophilisee. 500 jutg sont repris dans un tampon de rehydration. Ce tampon contient du 
Chaps (3-[(3-cholainidopropyl)dimethylammonio]-l-propane-sulfonate ; Sigma) k 4%, 
1% de DTT fraichement prepare, cocktail d'inhibiteurs de protease (Bohringher), 50 
jig/ml de TLCK (inhibiteur de la trypsine), 1 \x\ de Bleu de Br^mophenol k 1%. 

Le melange est sonique et centrifuge pour eliminer le materiel non dissous. On 
depose ensuite de Thuile de roche aux deux extr6mites du support de la bande 
d' electrofocalisation, et on depose ensuite Techantillon au milieu. La bande de 17 cm 
est ensuite deposee sur Fechantillon en eliminant toute bulle d'air. La bande est alors 
recouverte d*huile de roche pour eviter Tevaporation de Techantillon. 

Une rehydratation active est alors realisee a 50V (20°C durant 12 heures). Ensuite 
nous procedons a la focalisation apres avoir recouvert la bande de 2 papiers wiks 
(Biorad) mouilles en contact avec les deux electrodes durant deux jours. 

La bande sera ensuite recuperee et placee sur un gel en gradient d'acrylamide 6- 
18%, de iargeur 18 cm, de longueur 20 cm et d'epaisseur 1 mm. Ce gel a ete coule a un 
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debit constant de 8,4 ml/min, a l'aide d'un formeur de gradient. La separation des 
proteines sera alors realisee en fonction de leur taille apres avoir scelle la bande en haut 
du gel a l'aide d'une solution d' agarose a 1%. Une fois separees, les bandes proteiques 
sont revelees sur gel par coloration au bleu de Coomassie (Coomassie® G250). 

Construction du gel en gradient 

Vingt-cinq ml de solution dense a 18% de polyacrylamide (acrylamide 2,5 M ; 
Tris 0,4 M ; Glycerol 30% (v/v) ; dodecyl sulfate de sodium (SDS) 3,5 mM ; TEMED 
(>T,N,N%N'-t6tram6myl6mylenediamine ; Sigma) 0,05% (v/v) ; persulfate de sodium 
1,6 mM) sont places dans la chambre de melange sous agitation constante tandis qu'un 
meme volume de solution 16gere a 6% de polyacrylamide (acrylamide 0,8 M ; Tris 0,4 
M ; SDS 3,5 mM ; TEMED 0,06% (v/v) ; persulfate de sodium 2,4 mM) est place dans 
l'autre chambre. Le haut du gel est recouvert d'une solution d'isobutanol saturee en eau 
bidistill6e. Le gel est ensuite laisse 1 h a polymeriser a temperature ambiante puis le. 
haut du gel est rince plusieurs fois avec de l'eau bidistillee et l'ensemble est place une 
nuit a 10°C. Apres avoir enleve l'eau residuelle a l'aide d'un papier absorbant, la 
solution de gel de concentration (acrylamide 0,56 M ; methylene bis-acrylamide 6,9 
mM ; Tris 124 mM ; SDS 3,5 mM ; TEMED 0,05% (v/v) ; persulfate de sodium 2,2 
mM) est coulee sur le gel de separation et une cale permettant de former 1' empreinte de 
la bande est introduite dans la solution gel de concentration. La polymerisation est 
complete apres 1 h a temperature ambiante. 

Migration electrophoretique des proteines. 

La migration est effectuee en enceinte refrigeree a 10°C,pendant 14h a 400 V, 25 
mAetlOOW. 

Coloration au bleu de Coomassie colloidal 

Le gel de polyacrylamide est tout d'abord lave a l'eau distillee 3x30 minutes. 

Le gel est ensuite plac6 pendant une heure dans un recipient en inox contenant 
150 ml de solution commerciale de bleu de Coomassie, sous agitation douce, a 
temperature ambiante. Apres quatre lavages a l'eau bidistillee, le gel est finalement 
conserv6 a 4°C dans l'eau sterile jusqu'a l'excision des bandes polypeptidiques. 
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Digestion des proteines separees sur gel ID 

Chaque bande polypeptidique du gel est decoupee de maniere systematique tous 
les -2 mm sur toute leur longueur. Chaque morceau gel arinsi obtenu-est^ouifiis t use 
digestion enzymatique. Cette etape de digestion enzymatique est. essentielle. Elle 
consiste a hydrolyser les proteines de facon specifique, a l'aide d'une enzyme, en 
plusieurs peptides, pennettant ainsi leurs extractions du morceau de gel. 



Etape de decoloration, reduction, alkylation 

Avant de debuter la digestion, des etapes de decoloration, de reduction et 
d' alkylation sont indispensables : 

• les lavages successifs a l'hydrogenocarbonate d'ammonium (NH4HCO3) et a 
l'ac6tonitrile (ACN) permettent d'eliminer l'agent de coloration present dans le 
morceau de gel, 

• les reactions de reduction au dithiothreitol (DTT) et d'alkylation a 
l'iodoacetamide permettent l'ouverture puis le blocage des ponts disulfiires formes entre 
deux cysteines presentes dans la sequence de la proteine et des liaisons cysteine- 
acrylamide. 

Etape de digestion 

L'6tape de digestion proprement dite, utilise une endoprotease, la trypsine (25 
kDa). Cette enzyme coupe la prot6ine par une hydrolyse au niveau C-terminal de la 
lysine et de l'arginine, donnant gen6ralement des peptides de masses comprises entre 
500 et 2500 Da. 

Etape d' extraction 

La. derniere etape de la m&hode consiste a extraire du gel les peptides trypsiques a 
l'aide d'une solution d'extraction, composee d , ac6tonitrile et d'eau, additionn6e d'un 
peu d'acide. 

Analyse par nanoLC-MS-MS 

Les peptides extraits sont ensuite transferes vers la plaque PCR. Ce transfert se 
fait en deux fois 15 uL, pour recuperer la totalite du volume. Pour eliminer 
racetonitrile, qui pourrait gener la retention des peptides sur la pre-colonne, un temps 
d'evaporation (pause) de 2 heures est applique avant l'analyse par nanoLC-MS-MS. 
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Les matrices d'ADN complementaires utilisees pour les reactions de PCR ont ete 
synthetisees a partir d'ARN messagers purifies a partir d'ARN totaux extraits sur des 
Arenicoles, en raison de la petite faille des organises et de leur rythme intense de 
croissance traduisant des niveaux importants ^expression des genes, dont ceux 
impliqu6s dans la synthese de Hxemoglobine. Les ADN complementaires ont ainsi ete 
synthetis6s. Ces etapes ont fait appel a des kits commerciaux de biologie moleculaire de 
chez Ambion (purification des ARNs), Amersham (purification des ARNm), Promega 
(RT), Invitrogene (clonage), Abgene (sequencage). 

' Dans un second temps, nous avons mis au point les r6actions de PCR, notamment 
en ce qui concerne la determination des parametres de temps de denaturation, de temps 
et de temperature d'hybridation et de temps d'elongation. Les concentrations en MgCl 2 

ont egalement ete optimisees. 

Sont presentees ci-dessous, les sequences nucleotides des amorces degenerees 
sens et antisens, les parametres des PCR et les sequences codantes partielles pour 
chacune des globines A2a, A2b, Al et B2. 

Pour les chaines de structures, on utilise les amorces susmentionnees 

SEQ ID NO : 17 et SEQ ID NO : 18. 

On precise que 1'analyse totale de ces sequences par un blast dans les banques de 
donnees donne des valeurs comprises entre 2.10" 3 < Evalue < 5 e " 31 . 



aiohine A2 (a) 



Pour obtenir la sequence nucleotidique SEQIDNO : \ codant pour la globine 
A2(a) (SEQ ID NO: 2), on utilise le couple d'amorces (SEQIDNO :9; 
SEQ ID NO : 10). 



Les conditions de PCR sont les suivantes : 

Temps et temperature initiale de denaturation 
Temps et Temperature de denaturation : 
Temps et Temperature d'hybridation : 
Temps et Temperature d'elongation : 



4mina95°C 
30 s a 95°C 
30sa56°C > 35 cycles 
40sa72°C 
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Temps et Temperature d'elongation finale : 1 0 min a 72°C 

Reaction de PCR : " 

Par reaction : 1 pL ADNc 

100 ng amorce sens 

lr00-ng- amoree-antisens 

dNTP 200 uM final 
MgCl 2 2mM final 
Tampon PCR IX final 
1 unite Taq Polymerase 
Qsp 25 nL H 2 0 



Globine A2 (b) 

Pour obtenir la sequence nucleotidique SEQ ID NO : 3 codant pour la globine 
A2(b) (SEQ ID NO: 4), on utilise le couple d'amorces (SEQIDNO:ll; 
SEQ ID NO : 12). 

Les conditions de PCR sont les suivantes : 



PCR [I) : 4mina95°C 
30sa95°C 
30 s a 52°C 
40sa72°C 
10mina72°C 



35 cycles 



PCR (2) : 4 min a 95°C 
30sa95°C ^ 
30 s a 52°C > 35 cycles 
40 s k 72°C J 
10 min a 72°C 



Globine Al 



Pour obtenir la sequence nucleotidique SEQ ED NO : 5 codant pour la globine Al 
(SEQ ID NO : 6), on utilise le couple d'amorces (SEQ ED NO : 13 ; SEQ ID NO : 14). 
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Les conditions de PCR sont les suivantes : 

PCR : 4 niin a 95°C 

lmina95°C ^ 

1 min a 50°C > 35 cycles 

lmm30a72°C J 

10mina72°C 



GlobineB2 



Pour obtenir la s6quence nucleotidique SEQ ID NO : 7 codant pour la globine B2 
(SEQ ID NO : 8), on utilise le couple d'amorces (SEQ ID NO : 15 ; SEQ ID NO : 16). 



Les conditions de PCR sont les suivantes : 



PCR f IV . 4mina95°C 
30 s a 95°C 
40 s a 52°C 
30 sa72°C 
10mina72°C 



35 cycles 



PCR (2) : 4mina95°C 
30sa95°C 
40sa52°C 
30sa72°C 
10mina72°C 



35 cycles 
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REVINDICATIONS 



, Precede de dissociation de la module d'hemoglobine extiacellulaire 
dWlides, notammen, d« fa permeUan, Vob«ention des dix cbanres 

nroteiques constituant ladite mol6cule, 

Ltp^deaaatoaracteriscencequ-ilcompre^^etapedo^se^prcsence 

d . m SobantiUon d'hemoglobin. extraeellulaire glides, no_, dV*-** 
maHm avec au moins un agen, dissociant, —en, « * 
dithiothredol (DTT) on de cblorhvdra,e de ttisC^carboxy^tnyDphosprune (TCEP) ou de 
Mta-mercaptoeuranol et d-un tampon de dissociation, pendant an temps suflisan, pour 
siparer les chaines proteiques les unes des autres. 

2 Proceddde dissociation selon la tevendicationl.caiacterise en ceqnele 

^ de dissociation compxend 0,1 M de base Trisnra (^bydroxym*^ 
ammometitan^etOilOmMd-EDTAajustdaonpHcomprisd-env.ronSaenvnonW. 

3 Procedi de dissociation selon la revendication 1 on 2, caraCeris* en ce que 
ta dix'enames proves consu«uan« ladite molecule son, obtenues pax U d— r 
de qnatxe sous-unites pa, exemple en presence de DTT, lesdr.es sous-unttes etan eUe^ 
m L obtenues par mise en presence don cchantillon d-bemoglobme ex,— e 
M ola .naHna avec differents agenrs dissociants, notammen, un tampon de 



dissociation. 



4 Precede de preparation de couples d'amorces a partir des cosines proteiques 
teUes qu-oMenues seXon le precede «e, que defini dans Tune des revendications 1 a 3, 
lemtpreced^wrtcarsc^eneequ-Ucomprendlesetapessuivantes: 

_ l-isolemen, de obacune des dix cbatnes pro,ei,ues eonstibran, la molecule 
a-htaogiobine tettes qu'obtenues selon le precede « que defini selon 1'une des 



revendications 1 a 3, ; Qn ipe<? 

_ ,e mrcroseuuensage de obacune des dix cbarnes proterques tsoleos 
susm en« ionnees par spectiometiie de masse, afin dob,enrr une mrcrosequence 
cerrespondan, a cnacune des dix sequences constimees de 5 a 2 0 acrdes auunes, e, 
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- la determination de dix couples d'amorces degenerees a partir des 
microsequences susmentionnSes. 

5. Couples d'amorces tels qu'obtenus selon le procede de la revendication 4, 
lesdits couples etant notamment les suivants : 




. ^Amorce sens ^ GAR— TGY-GGN - C^N ~TTR~CAR~ "CG 

Amorce antisens : CCA NGC NTC YTT RTC RAA GCA 

b) Amorce sens : AN tgy ggn ccn ctn car CG 

Amorce antisens : CCA NGC NTC YTT RTC RAA GCA 



c) Amorce sens : AAR GTI AAR CAN AAC TGG 
Amorce antisens : CCA NGC NCC DAT RTC RAA 

d) Amorce sens : TGY TGY AGY ATH GAR GAY CG 
Amorce antisens : CA NGC NYC RCT RTT RAA RCA 

e) Amorce sens : GAY GAY TGY GTN TGY CC 
Amorce antisens : ANA CRA ART CRT CNC CRC A 

ou : 

R represente A ou G, 

Y represente C ou T, f 
N represente A, G, C ou T, 
I repr6sente Pinosine, 
D represente A, G ou T, 
H represente A, C ou T 

6. Procede de preparation de sequences nucleotidiques codant pour les chaines 
proteiques constituant la molecule d'hemoglobine d'Arenicola marina, a partir des 
amorces telles qu'obtenues selon le procede de la revendication 4 ou 5, ledit procede 
etant caracterise en ce qu'il correspond a un procede d'amplification en chaine par 



40 



_ la detemunation de dix couples d'amorces degenerees a partir des 
microsequences susmentioimees. 

5. Couples d'amorces tels qu'obtenus selon le procede de la revendication 4, 
lesdits couples etant notamment les suivants : 

a) Amorce sens : GAR TGY GGN CCN TTR CAR CG 
Amorce antisens: CCA NGC NTC YTT RTC RAA GCA 

b) Amorce sens : . AN TGY GGN CCN CTN CAR CG 
Amorce antisens : CCA NGC NTC YTT. RTC RAA GCA . 

C) Amorce sens : AAR GTI AAR CAN AAC TGG 

Amorce antisens : CCA NGC NCC DAT RTC RAA 

d) Amorce sens : TGY TGY AGY ATH GAR GAY CG 
Amorce antisens: CA NGC NYC RCT RTT RAA RCA 

e) Amorce setts : GAY GAY TGY GTN TGY CC 
Amorce antisens : ANA CRA ART CRT CNC CRC A 

oil : 

R repr6sente A ou G, 
Y repr6sente CouT, 
N represente A, G, C ou T, 
I represente Tinosine, 
D represente A, G ou T, 
H represente A, C ou T 

6 Precede taxation d« fences nucleotidiques codant poor les chaines 
proves constituent la molecule d'hemoglobin. Menicola mari,u,, a p^r des 
_ telles qu'obtenues selon le procede de .a revendieation 4 ; le*« procede *an< 
cerise en oe qu'U correspond a on procerle d-ampUncauon en chaure par 
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polymerase (PCR), comprenant une repetition d'au moins 30 fois du cycle constitue par 
les etapes suivantes : 

* la- denaturation, par -chauffage; de VABNc codant pour chactmenies 'dix 

chaines proteiques constituant la molecule d'hemoglobine d'Arenicola marina^ de 
fa?on a separer l'ADNc en deux brins monocatenaires, ledit ADNc etant obtenu a 
partir d'AKNm mature, 

^-l%ybridation-des-couples-d^ 

revendication 4 aux brins d'ADNc monocatenaires susmentionnes k une 
temperature adequate, pour obtenir des amorces hybridees, et 

* 1'elongation des amorces hybridees par une polymerase k une temperature 
adequate. 

7. Procede de preparation selon la revendication 6, caracterise en ce que : 

- la premiere etape dudit procede est une etape de denaturation d'environ 10 
secondes a environ 5 minutes a une temperature comprise d'environ 90°C a environ 
110°C, 

- le cycle, repete environ 30 k 40 fois, comprend les etapes suivantes : 

* une etape de denaturation d' environ 10 secondes a environ 5 minutes, a une 
temperature comprise d'environ 90°C a environ 110°C, 

* une etape d'hybridation d'environ 20 secondes a environ 2 minutes, a une 
temperature comprise d'environ 50°C a environ 56°C, 

* une etape d' elongation d'environ 20 secondes a environ 1 minute et 30 
secondes, a une temperature comprise d'environ 70°C k environ 75°C, et 

- la dernifere 6tapedu procede est une etape d'elorgatibn d'environ 5 minutes k 
environ 15 minutes a une temperature comprise d'environ 70°C a environ 75°C 

8. Procede de preparation selon la revendication 6 ou 7, caracterise en ce que 
les couples d' amorces utilises sont tels que definis dans la revendication 5. 

9. Procede de preparation selon la revendication 8, caracterise en ce que le 
couple d' amorces utilise est le suivant : (gar tgy ggn ccn ttr car cg ; cca ngc 
ntc ytt rtc raa gca), R, Y et N etant tels que definis dans la revendication 5, 

ledit procede etant caracteris6 en ce que : 
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- la premiere etape du precede est une etape de d6naturation de 4 minutes a une 

temperature 6gale a 95°C, 

- le cycle, repet6 35 fois, comprend les etapes suivantes : 

* une etape de denaturation de 30 secondes a une temperature egale a 95°C, 

* une etape d'hybridation de 30 secondes a une temperature egale a-56 Q C, 

* une etape d'elongation de 40 secondes a une temperature egale a 72°C 5 et 

- la derniere etape du procede est une etape d'61ongation de 10 minutes a une 

temperature egale a 72°C, 

afin d' obtenir la sequence nucleotidique SEQ ID NO : 1 . 

10. Proced6 de preparation selon la revendication 8, caracterise en ce que le 
couple d'amorces utilise est le suivant: (an tgy ggn ccn ctn car cg ; cca ngc 
ntc ytt rtc raa gca), N, Y et R etant tels que d6finis dans la revendication 5, ' 
ledit procede 6tant caracterise en ce que : 

- la premiere etape du procede est une etape de denaturation de 4 minutes a une - 

temperature egale a 95°C, 

- le cycle, repete 35 fois, comprend les etapes suivantes : 

* une etape de denaturation de 30 secondes a une temperature 6gale a 95°C, 

* une etape d'hybridation de 30 secondes a une temperature egale a 52°C, 

* une 6tape d'elongation de 40 secondes a une temperature egale a 72°C, et 

_ la derniere etape du procede est une etape d'elongation de 10 minutes a une 

temperature egale a 72°C, 

afin d'obtenir la sequence nucleotidique SEQ ID NO : 3. 

11. Procede de preparation selon la revendication 8, caracterise en ce que le 
couple d'amorces utilise est le suivant : (aar gti aar can aac tgg ; cca ngc 
N cc dat rtc raa), R, I, N et D etant tels que dermis dans la revendication 5, 
ledit procede etant caracterise en ce que : 

- la premiere etape du P roc6de est une etape de denaturation de 4 minutes a une 

temperature 6gale a 95°C, 

- le cycle, repetd 35 fois, comprend les etapes suivantes : 

* une etape de denaturation de 1 minute a une temperature egale a 95°C, 

* une etape d'hybridation de 1 minute a une temperature egale a 50°C, 
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* une etape d'elongation de 1 minute et 30 secondes a une temperature egale a 
72°C, et 

la derniere 6tape du procede est une etaperd'Slongatioird^ 

temperature egale a 72°C, 

afin d'obtenir la sequence nucleotidique SEQ ID NO : 5. 

1-2. — Proeed6-de -preparation -selonte 

couple d' amorces utilise est le suivant : (tgy tgy agy ath gar gay cg ; ca ngc 
nyc rct rtt raa rca), Y, H, R et N etant tels que definis dans la revendication 5, 
ledit procede etant caracterise en ce que : 

- la premiere etape du procede est une etape de denaturation de 4 minutes a une 
temperature egale a 95°C, 

- le cycle, repete 35 fois, comprend les etapes suivantes : 

* une etape de denaturation de 30 secondes k une temperature egale a 95°C, 

* une etape d'hybridation de 40 secondes a une temperature egale a 52°C, 

* une etape d'elongation de 30 secondes a une temperature egale a 72°C, et 

- la derni&re etape du procede est une etape d'elongation de 10 minutes a une 
temperature egale a 72°C, 

afin d'obtenir la sequence nucleotidique SEQ ID NO : 7. 

13- Proteines codees par Tune des sequences telles qu'obtenues selon le procede 
tel que defini dans Tune quelconque des revendications 6 a 12. 

14. Proteine selon la revendication 13, caracterisee en ce qu'elle comprend ou 
est constituee par : 

- la sequence SEQ ID NO : 2, 

- ou toute sequence derivee de la sequence SEQ ID NO : 2 ou d'un fragment 
defini ci-dessous, notamment par substitution, suppression ou addition d'un ou plusieurs 
acides amines, sous reserve que ladite sequence derivee permette le transport de 
Poxygene, 

- ou toute sequence homologue de la sequence SEQ ID NO : 2 ou d ! un fragment 
defini ci-dessous, ayant de preference une homologie d'au moins environ 75%, avec la 
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sequence SEQ ID NO : 2, sous reserve que ladite sequence homologue permette le 

transport de l'oxygene, 

- ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de l'oxygene, notarmnent tout fragment etant constitue 
d'au moins environ 60 acides amin6s, et notamment d'au moins environ 160 acides 
amines contigus dans la s6quence SEQ ID NO : 2. 

15. Proline selon la revendication 13, caracterisee en ce qu'elle comprend ou 

est constituee par : 

- las6quenceSEQIDNO: 4, 

- ou toute sequence derivee de la sequence SEQ ID NO : 4 ou d'un fragment 
defrni ci-dessous, notamment par substitution, suppression ou addition d'un ou plusieurs 
acides amines, sous reserve sous reserve que ladite sequence deriv6e permette le 

transport de l'oxygene, 

- ou toute sequence homologue de la sequence SEQ ID NO : 4 ou d'un fragment 
defrni ci-dessous, ayant de preference une homologie d'au moins environ 75%, avec la 
s6quence SEQ ID NO :4, sous reserve que ladite sdquence homologue permette le 

transport de l'oxygene, 

- ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de l'oxygene, notamment tout fragment etant constitue 
d'au moins environ 60 acides amines, et notamment d'au moins environ 160 acides 
amines contigus dans la sequence SEQ ID NO : 4. 

16. Proteine selon la revendication 13, caracterisee en ce qu'elle comprend ou 

est constituee par : 

- la sequence SEQ ID NO : 6, 

- ou toute sequence derivee de la sequence SEQ ID NO : 6 ou dun fragment 
defrni ci-dessous, notamment par substitution, suppression ou addition d'un ouplusieurs 
acides amines, sous r6serve sous reserve que ladite sequence derivee permette le 

transport de l'oxygene, 

_ ou toute sequence homologue de la sequence SEQ ID NO : 6 ou dun fragment 
defrni ci-dessous, ayant de preference une homologie d'au moins environ 75%, avec la 
sequence SEQ ID NO : 6, sous reserve que ladite sequence homologue permette le 
transport de l'oxygene, 
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sequence SEQ ID NO : 2, sous reserve que ladite sequence homologue permette le 

transport de l'oxygene, 

Z "ou tout fegment d'urie'des sequences defihiesci-dessus, sous reserve que ledit 
fragment permette le transport de l'oxygene, notamment tout fragment etant constitue 
d'au moins environ 60 acides amines contigus dans la s6quence SEQ ID NO : 2. 



157 ^rtiine selon. la revindication 13, caracterisee" en ice qu'elle comprend ou 

est constitute par : 

- la sequence SEQ ID NO : 4, 

10 _ ou toute sequence derivee de la sequence. SEQ ID NO : 4 ou d'un fragment 

defini ci-dessous, notamment par substitution, suppression ou addition d'un ou plusieurs 
acides amin6s, sous reserve sous reserve que ladite sequence deriv6e permette le 
transport de l'oxygene, 

- ou toute sequence homologue de la sequence SEQ ID NO : 4 ou d'un fragment 
15 defini ci-dessous, ayant de preference une homologie d'au moins environ 75%, avec la 

sequence SEQ ID NO : 4, sous reserve que ladite sequence homologue permette le 
transport de l'oxygene, 

- ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de l'oxygene, notamment tout fragment etant constitue 

20 d'au moins environ 60 acides amines contigus dans la sequence SEQ ID NO : 4. 

16. Proteine selon la revendication 13, caracterisee en ce qu'elle comprend ou 

est constituee par : 

- las6quenceSEQIDNO : 6, 

2 5 - ou toute sequence derivee de la sequence SEQ ID NO : 6 ou d'un fragment 

defini ci-dessous, notamment par substitution, suppression ou addition d'un ou plusieurs 
acides amines, sous reserve sous reserve que ladite sequence derivee permette le 
transport de l'oxygene, 

- ou toute sequence homologue de la sequence SEQ ID NO : 6 ou d'un fragment 
30 defini ci-dessous, ayant de preference une homologie d'au moins environ 75%, avec la 

sequence SEQ JD NO : 6, sous reserve que ladite sequence homologue permette le 
transport de l'oxygene, 
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- ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de l'oxygene, notamment tout fragment Start constitue 
d'au moins environ 60 aoides amines, et notamment d'au moins environ 160 acides 
amines contigus dans la s6quence SEQ ID NO : 6. 

17. Proteine selon la revendication 13, caracterisee en ce qu'elle comprend ou 

est constituee par : 

_ la sequence SEQ ID NO : 8, 

- ou toute sequence derivee de la sequence SEQ ID NO : 8 ou d'au fragment 
defini ci-dessous, notamment par substitution, suppression ou addition d'un ou plusieurs 
acides amines, sous r6serve que ladite sequence derivde permette le transport de 
l'oxygene, 

- ou toute s6quence homologue de la s6quence SEQ ID NO : 8 ou dun fragment 
defini ci-dessous, ayant de preference une homologie d'au moins environ 75%, avec la 
sequence SEQ ID NO : 8, sous reserve que ladite sequence homologue permette le 

transport de l'oxygene, _ 

_ ou tout fragment d'une des sequences definies ci-dessus, sous reserve que led* 
fragment permette le transport de l'oxygene, notamment tout fragment etart constitue • 
d'au moins environ 60 acides amines, et notamment d'au moins environ 160 acides 
amines contigus dans la s6quence SEQ ID NO : 8. 

18. S6quences nucleotides telles qu'obtenues selon le proc6d6 tel que defini 
dans l'une quelconque des revendications 6 a 12. 

19. Sequences nucleotides codant pour une P rot6ine telle que definie dans 
Tune des revendications 13 a 17. 

20. Sequence nucleotidique selon la revendication 19, caracterisee en ce qu'elle 

comprend ou est constituee par : 

- la sequence nucleotidique SEQ ID NO : 1 codant pour SEQ ID NO : 2, 

- ou toute s6quence nucleotidique derivee, par degenerescence du code 
genetique, de la sequence SEQ ID NO : 1, et codant pour une proteine representee par 
SEQ ID NO : 2, 
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- ou tout fragment d'une des sequences definies ci~dessus, sous reserve que ledit 
fragment permette le transport de l'oxygene, notarament tout fragment etant constitue 
d'au moins environ 60 acides amines contigus dans la sequence SEQ ID NO : 6. 

17. Proteine selon la revendication 13, caracterisee en ce qu'elle comprend ou 
est constituee par : 

la sequence SEQ ID NOT~8, 

- ou toute sequence derivee de la sequence SEQ ID NO : 8 ou d*un fragment 
defini ci-dessous, notamment par substitution, suppression ou addition d'un ou plusieurs 
acides amines, sous reserve que ladite sequence derivee permette le transport de 
l'oxygene, 

- ou toute sequence homologue de la sequence SEQ ID NO : 8 ou d'un fragment 
d6fini ci-dessous, ayant de preference une homologie d'au moins environ 75%, avec la 
s6quence SEQ ID NO : 8, sous reserve que ladite sequence homologue permette le 
transport de Toxygene, 

- ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de l'oxygene, notamment tout fragment etant constitue 
d'au moins environ 60 acides amines contigus dans la sequence SEQ ID NO : 8. 

18. Sequences nucl6otidiques telles qu'obtenues selon le procede tel que defini 
dans Tune quelconque des revendications 6 a 12. 

19. Sequences nucleotidiques codant pour une proteine telle que definie dans 
Tune des revendications 13 a 17. f 

20. Sequence nucleotidique selon la revendication 19, caracterisee en ce qu'elle 
comprend ou est constituee par : 

- la sequence nucleotidique SEQ ID NO. : 1 codant pour SEQ ID NO : 2, 

- ou toute sequence nucleotidique derivee, par degenerescence du code 
genetique, de la sequence SEQ ID NO : 1, et codant pour une proteine representee par 
SEQ ID NO : 2, 

- ou toute sequence nucleotidique derivee, notamment par jsubstitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 1 
codant pour une proteine derivee de SEQ ID NO : 2, 
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- ou toute sequence nucleotidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 1 
codant pour une proteine derivee de SEQ ID NO : 2, 

- ou toute sequence nucleotidique homologue de SEQ ID NO : 1, ayant de 
preference une homologie d'au moins environ 60%, avec la s6quence SEQ ID NO : 1 , 

- ou tout fragment de la sequence nucleotidique SEQ ID NO : 1 ou des 
sequences nucl6otidiques definies ci-dessus, ledit fragment etant de preference constitue 
d'au moins environ 180 nucleotides, et notamment d'au moins environ 480 nucleotides 

contigus dans ladite sequence, 

_ ou toute sequence nucleotidique complementaire des sequences ou fragments 

susmentionnes, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'une des sequences ou d'un des 
fragments susmentionnes. 

21. Sequence nucl6otidique selon la revendication 19, caracterisee en ce qu'elle 

comprend ou est constituee par : 

_ la sequence nucleotidique SEQ ID NO : 3 codant pour SEQ ID NO : 4, 

_ ou toute s6quence nucleotidique derivee, par degenerescence du code 

genetique, de la sequence SEQ ID NO : 3, et codant pour une proteine representee par 

SEQ ID NO :4, 

_ ou toute sequence nucleotidique deriv6e, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 3 
codantpouruneprot6ined6riveedeSEQIDNO:4, , 

_ ou toute sequence nucl6otidique homologue de SEQ ID NO :3, ayant de 
preference une homologie d' au moins environ 60%, avec la sequence SEQ ID NO : 3 

- ou tout fragment de la sequence nuc!6otidique SEQ ID NO : 3 ou des 
sequences nuclcotidiques definies ci-dessus, ledit fragment etant de pr6ference constitue 
d'au moins environ 180 nucleotides, et notamment d'au moins environ 480 nucleotides 

contigus dans ladite sequence, 

_ ou toute sequence nucleotidique complementaire des sequences ou fragments 

susmentionnes, 
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- ou toute sequence nucleotidique homologue de SEQ ID NO : 1, ayant de 
preference une homologie d'au moins environ 60%, avec la sequence SEQ ID NO : 1, 

""*■_ ou tout 'fragiient de" la sequence nucleotidique SEQ ID NO : 1 ou des 
sequences nucleotidiques definies ci-dessus, ledit fragment etant de preference constitue 
d'au moins environ 1 80 nucleotides contigus dans ladite sequence, 

- ou toute sequence nucleotidique complementaire des sequences ou fragments 
"susmentionnes, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'une des sequences ou d'un des 
fragments susmentionnes. 

21. Sequence nucleotidique seldn la revendication 19, caracterisee en ce qu'elle 
comprend ou est constituee par : 

- la sequence nucleotidique SEQ ID NO : 3 codant pour SEQ ID NO : 4, 

- ou toute sequence nucleotidique derivee, par degen6rescence du code 
genetique, de la sequence SEQ ID NO : 3, et codant pour une proteine representee par 
SEQ ID NO : 4, 

- ou toute sequence nucleotidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 3 
codant pour une proteine derivee de SEQ ID NO : 4, 

- ou toute sequence nucleotidique homologue de SEQ ID NO : 3, ayant de 
preference une homologie d'au moins environ 60%, avec la sequence SEQ ID NO : 3, 

- ou tout fragment de la sequence nucleotidique SEQ ID NO : 3 ou des 
sequences nucleotidiques definies ci-dessus, ledit fragment et^nt de preference constitue 
d'au moins environ 180 nucleotides contigus dans ladite sequence, 

- ou toute sequence nucleotidique complementaire des sequences ou fragments 
susmentionnes, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'une des sequences ou d'un des 
fragments susmentionnes. 
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- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complements d'une des sequences ou d'un des 
fragments susmentionn6s. 

22. Sequence nucleotidique selon la revendication 19, caracteris6e en ce.qu'elle 

comprend ou est constitute par : 

_ la sequence nucleotidique SEQ ID NO : 5 codant pour SEQ ID NO : 6, 

ou toute sequence nucleotidique derivee, par degenerescence du code 
genetique, de la sequence SEQ ID NO : 5, et codant pour une proteine repr6sentee par 
SEQ ID NO : 6, 

- ou toute sequence nucl6otidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucl6otides, de la sequence SEQ ID NO : 5 
codant pour une proteine derivee de SEQ ID NO : 6, 

_ ou toute sequence nucl6otidique homologue de SEQ ID NO : 5, ayant de 
P r6ference une homologie d'au moins environ 60%, avec la s6quence SEQ ID NO ? 

- ou tout fragment de la sequence nucleotidique SEQ ID NO : 5 ou des ? 
sequences nucleotidiques definies ci-dessus, ledit fragment etant de preference constitu6 
d'au moins environ 180 nucleotides, et notamment d'au moins environ 480 nucleotides . 
contigus dans ladite sequence, ■ i 

- ou toute sequence nucleotidique complementaire des sequences ou fragments 

susmentionnes, , 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'une des sequences ou d'un des 
fragments susmentionnes. ? 

.23. S6quence nucl6otidique selon la revendication 19, caracteris6e en ce qu'elle 

comprend ou est constituee par : 

- la sequence nucleotidique SEQ ID NO : 7 codant pour SEQ ID NO 

- ou toute sequence nucleotidique derivee, par degenerescence du code 
genetique, de la sequence SEQ ID NO : 7, et codant pour une proteine representee par 
SEQ ID NO: 8, 
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22. Sequence nucleotidique selon la revendication 19, caracterisee en ce qu'elle 
comprend ou est constituee par : 

- " la"sequehce nucIebMi que SEQ ID NO : 5 codant pour SEQ ID NO : 6, 

- ou toute sequence nucleotidique derivee, par degenerescence du code 
gen6tique, de la sequence SEQ ID NO : 5, et codant pour une proteine representee par 

SEQ ID NO : 6, 

-^ou "toute ~s6^Vnce"lmcl6oti<fique deriv6e, nota mm ent par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 5 
codant pour une proteine derivee de SEQ ID NO : 6, 

- ou toute s6quence nucleotidique homologue de SEQ ID NO : 5, ayant de 
preference une homologie d'au moins environ 60%, avec. la sequence SEQ ID NO : 5, 

- ou tout fragment de la. sequence nucleotidique SEQ ID NO : 5 ou des 
sequences nucleotidiques definies ci-dessus, ledit fragment etant de pr6ference constitue 
d'au moins environ 180 nucleotides contigus dans ladite sequence, 

- ou toute sequence nucleotidique complSmentaire des sequences ou fragments 
susmentionnes, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'une des sequences ou d'un des 
fragments susmentionnes. 

23. Sequence nucleotidique selon la revendication 19, caracterisee en ce qu'elle 
comprend ou est constituee par : 

- la sequence nucleotidique SEQ ID NO : 7 codant pour SEQ ID NO : 8, 

- ou toute sequence nucleotidique derivee, par degenerescence du code 
genetique, de la sequence SEQ ID NO : 7, et codant pour une proteine representee par 
SEQ ID NO: 8, 

- ou toute sequence nucleotidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 7 
codant pour une proline derivee de SEQ ID NO : 8, 

- ou toute sequence nucleotidique homologue de SEQ ID NO : 7, ayant de 
preference une homologie d'au moins environ 60%, avec la sequence SEQ ID NO : 7, 
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- ou toute sequence nucleotidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 7 
codant pour une prot6ine derivee de SEQ ID NO : 8, 

- ou toute sequence nucleotidique homologue de SEQ ID NO : 7, ayant de 
preference une homologie d'au moins environ 60%, avec la sequence SEQ ID NO : 7, 

- ou tout fragment de la s6quence nucleotidique SEQ ID NO : 7 ou des 
sequences nucleotides definies ci-dessus, ledit fragment etant de preference constitue 
d'au moins environ 180 nucleotides, et notamment d'au moins environ 480 nucleotides 

contigus dans ladite sequence, 

_ ou toute sequence nucl6otidique complementaire des sequences ou fragments 

susmentionnes, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'une des s6quences ou d'un des 
fragments susmentionnes. 

24. Precede de preparation selon la revendication 4, de sequences 
nucleotidiques codant pour les chaines proteiques constituant la mol6cule • 
d'hemoglobine d'Ann61ides, notamment VArenicola marina, ledit precede etant 
caracteris6 en ce qu'il comprend les 6tapes suivantes : 

_ une etape de mise en presence de la molecule d'hemoglobine susmentionnee 
avec au moins un agent dissociant, notamment un m61ange constitu6 de ditmothreitol 
(DTT) ou de cMorhydrate de tris(2-carboxyethyl)phosphine (TCEP) ou de beta- 
m ercaptoemanol et d'un tampon de dissociation, pendant un temps suffisant pour 
• separer les chaines proteiques les unes des autres, { 

permettant la dissociation de ladite molecule d'hemoglobine, afin d'obtenir les dix 
chaines proteiques constituant ladite mol6cule, 

- 1' isolement de chacune des dix chaines prot6iques susmentionnees, 
_ le microsequen9age de chacune des dix chaines proteiques isolees 
susmentionnees par spectrometrie de masse, afin d'obtenir une micros6quence 
correspondant a chacune des dix sequences constitutes de 5 a 20 acides amines, 

_ la domination des dix couples d'amorces degen6rees a part* des 
microsequences susmentionnees, 



"Tecue le 08/01/04 



48 



- ou tout fragment de la sequence nucl6otidique SEQ ID NO : 7 ou des 
sequences nucleotidiques definies ci-dessus, ledit fragment etant de preference constitue 
d'au'moins environ 180 nucleotides cohtigus dans ladite sequence, 

- ou toute sequence nucleotidique complementaire des sequences ou fragments 

susmentionnes, 

- ou toute sequence nucteotidique susceptible d'hybrider dans des conditions 
stimgeaates" Ivec Ta "sequence HcoinplernentaSe ""d^un^des "sequences rurrdes- 
fragments susmentionnes. 

24. Procede de pr6paration selon la revendication 6, de sequences 
nucleptidiques codant . pour les chaines proteiques constituant la molecule 
d'hemoglobine d'Annelides, notamment VArenicola manna, ledit procede etant 
caracterise en ce qu'il comprend les etapes suivantes : 

- une 6tape de raise en pr6sence de la mol6cule d'hemoglobine susmentionnee 
avec au moins un agent dissociant, notamment un melange constitue de dithiothrditol 
(DTT) ou de chlorhydrate de tris(2-carboxyethyl)phosphine (TCEP) ou de beta- 
mercaptoethanol et d'un tampon de dissociation, pendant un temps suffisant pour 
separer les chames proteiques les unes des autres, 

permettant la dissociation de ladite molecule d'hemoglobine, afin d'obtenir les dix 
chaines proteiques constituant ladite mol6cule, 

- l'isolement de chacune des dix chames proteiques susmentionnees, 

- le microsequencage de chacune des dix chames proteiques isolees 
susmentionnes par spectrom6trie de masse, afin d'obtenir une microsequence 
correspondent a chacune des dix s6quences constitu6es de 5 a 20 acides arnrn6s, 

- la determination des dix couples d'amorces degenerees a partir des 
microsequences susmentionnees, 

- la preparation des s6quences nucleotidiques codant pour les chaines proteiques 
■ susmentionnees, a partir des amorces telles qu'obtenues precedemment, par un procede 

d'amplification en chaine par polymerase (PCR), comprenant les etapes suivantes : 

- la premiere etape dudit procede est une etape de denaturation d' environ 10 
secondes a environ 5 minutes a une temperature comprise d' environ 90°C a environ 
110°C, 
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_ la preparation des sequences nucleotidiques codant pour les chames prot6iques 
susmentionnees, a partir des amorces telles qu'obtenues pr6cedemment, par un precede 
d'ampUfication en chaine par polymerase (PCR), comprenant les etapes suivantes : 

- la premiere etape dudit precede est une etape de denaturation d'environ 10 
secondes a environ 5 minutes a une temperature comprise d'environ 90°C a environ 
110°C, 

- le cycle, repet6 environ 30 a 40 fois, comprend les etapes suivantes : 

• * une etape de denaturation d'environ 10 secondes a environ 5 minutes, a une 
temperature comprise d'environ 90°C a environ 110°C, 

* une etape d'hybridation d'environ 20 secondes a environ 2 minutes, a une 
temperature comprise d'environ 50°C a environ 56°C, 

* une etape d'elongation d'environ 20 secondes a environ 1 minute et 30 
secondes, a une temperature comprise d'environ 70°C a environ 75°C, ef 

- la derniere 6tape du precede est une etape d'61oi£ation d'environ 5 minutes a 
environ 15 minutes a une tem P 6rature comprise d'environ 70°C a environ 75°C. . 
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- le cycle, repete environ 30 a 40 fois, comprend les 6tapes suivantes : 

* une etape de denaturation d' environ 10 secondes a environ 5 minutes, a une 
" temperature comprise "d 5 environ 90°C k environ 1 10°C, 

* une etape d'hybridation d'environ 20 secondes a environ 2 minutes, k une 
temperature comprise d' environ 50°C a environ 56°C, 

* une etape d'61ongation d' environ 20 secondes a environ 1 minute et 30* 
— — -— temperature comprise d' environ 70°C a environ 75°C, et 

- la derniere etape du precede est une 6tape d'eloigation d'environ 5 minutes a 
environ 15 minutes a une temperature comprise d J environ 70°C a environ 75°C. 
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LISTE DE SEQUENCES 
<110> CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQOE 

. <L20> - GLOB ' " " 

<130> IFB 03 CA CNR GLOB 
<160> 18 



• 



<170> Patentln version 3.1 



<210> 


1 


<211> 


376 


<212> 


ADN 


<213> 


Arenicola 


<220> 




<221> 


CDS 


<222> 


(1) . - (375) 


<223> 




<400> 


1 



gga cct ttg cag cgc etc ctg gtc aag acc cag tgg aac aag gtg tac 
Gly Pro Leu Gin Arg Leu Leu Val Lys Thr Gin Trp Asn Lys Val Tyr 
1 5 10 15 

ggc acc age aag gtc agg gac gag gec gga cac gtc etc tgg aag get 
Gly Thr Ser Lys Val Arg Asp Glu Ala Gly His Val Leu Trp Lys Ala 
20 25 30 

att ttc gee cag gat ccc gag acc egg get etc ttc aag aga gtc aac 
lie Phe Ala Gin Asp Pro Glu Thr Arg Ala Leu Phe Lys Arg Val Asn 
35 40 45 

ggt gac gac ate tac tct ccc gag ttc atg get cac age gee cgt gtc 
Gly Asp Asp lie Tyr Ser Pro Glu Phe Met Ala His Ser Ala Arg Val 
50 " 55 60 

ttg ggt ggc ctt gac att gee ate tec etc etc gac aac cag get gac 
Leu Gly Gly Leu Asp lie Ala lie Ser Leu Leu Asp Asn Gin Ala Asp 
65 ^ 70 75 80 

ctt gac gtc gee ctg get cac ctt cac gtg cag cac gta gad agg cac 
Leu Asp Val Ala Leu Ala His Leu His Val Gin His Val Glu Arg His 
85 90 95 

ate cca acc cgc tac ttc gat ctg ttc aag aac gec ctg atg gag tat 
lie Pro Thr Arg Tyr Phe Asp Leu Phe Lys Asn Ala Leu Met Glu Tyr 
100 ^ 105 110 

gee ccc age gee ctg gga cgc tgc ttt gat aag gac gca t 
Ala Pro Ser Ala Leu Gly Arg Cys Phe Asp Lys Asp Ala 
115 120 125 
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96 



144 



192 



240 



288 



336 



376 



<210> 2 

<211> 125 

<212> PRT 

<213> Arenicola marina 



G1 „ », -» V31 Lys « Gin «P As„ Lys val Tyt 
Ly Tht Set Lys Val At, W G!» OK His Vai Leu ftp Lys «. 

20 " 

Ile P*e Ala Gin Asp Pro Glu Thr Arg Ala Leu Phe Lys Arg Val Asn 



35 40 



Gly 



Rsp Asp lie Tyt Ser Pto Glu Phe Hat Ala His set Ala At, Vai 
50 55 

•65 70 " 



Le » Asp Val Ala Leu Ala His Leu His Val Gin His Val Glu Arg His 
Thr At, Tyx Phe Asp Leu Phe Lys Asn Ala lea Met Glu Tyt 

inn 105 



lie Pro 

100 

Ta „ rlv & ra cvs Phe Asp Lys Asp Ala 
Ala Pro Ser Ala Leu Gly Arg oys rn y l25 

115 ^ U 



<210> 3 
<211> 288 
<212> ADN 

<213> Arenicola marina 
<220> 

<221> CDS 

<222> (1) - - (288) 

<223> 

pB K £ f" S S » « = s S " S S I" S . 
« !f y E S = S S = i - ® K Se S 55 S 

20 25 
eat ,tc tt= ea, eac teg oet jet jo. e,e go at, tte aa, gc go 
His val Phe Gin His Set Pro Ala Ala At, Asp ^ 

CC „t Tac aac ate oao ace eca go tte at, ace oae J- see ojt 
Arg Gly Asp Asn lie His Tnr rro go 
50 " 

fa! £ Sfy C fee Asp S 5 S Ala fee fee £ £ K S 
65 ^ 

, tt et, aae ae, ea, ete jot cat ett joe aa, oa. oao ,a. see, e,t 
val Lea Asn Tht Gin Lea Ala His Leu Ala by 9J 
85 
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144 



192 



240 



288 
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<210> 4 
<211> 96 
<212> PRT 

<213>. ..Arenicola. marina- 



<400> 4 

Cys Gly Pro Leu Gin Arg Leu Lys Val Lys Arg Gin Trp Ala Glu Ala 
1 5 10 J 15 



Tyr Gly Ser Gly Asn Ser Arg Glu Glu Phe Gly His Phe lie Trp Ser 

20 2_5 30- 



His Val Phe Gin His Ser Pro Ala Ala Arg Asp Met Phe Lys Arg Val 
35 40 4 5 

Arg Gly Asp Asn lie His Thr Pro Ala Phe Met Ala His Ala Thr Arg 
50 55 60 

Val Leu Gly Gly Leu Asp Met Cys lie Ala Leu Leu Asp Asp Glu Pro 
65 70 75 80 

Val Leu Asn Thr Gin Leu Ala His Leu Ala Lys Gin His Glu Thr Arg 
85 90 95 



<210> 5 

<211> 360 

<212> ADN 

<213> Arenicola marina 
<220> 

<221> CDS 

<222> (1) . . (360) 

<223> 

<400> 5 

aag gtg aag cac caa tgg gtg cag gtg tac age ggc cat ggt tac gag 48 

Lys Val Lys His Gin Trp Val Gin Val Tyr Ser Gly His Gly Tyr Glu 
15 10 15 



cgt gag gcg ttc ggc aga 
Arg Glu Ala Phe Gly Arg 
20 

ccc aag gec aag gac etc 
Pro Lys Ala Lys Asp Leu 
35 

tec ccc gag ttc gga gec 
Ser Pro Glu Phe Gly Ala 
50 

atg tgc ate get ctg ctg 
Met Cys lie Ala Leu Leu 
65 70 



gag gtc ttc etc gag atg 
Glu Val Phe Leu Glu Met 
25 

ttc ace agg gtc agg ggc 
Phe Thr Arg Val Arg Gly 
40 

cac atg gtc cgt gtg etc 
His Met Val Arg Val Leu 
55 60 

tec gat gac acc gtc etc 
Ser Asp Asp Thr Val Leu 
75 



tac aac cag gca 96 
Tyr Asn Gin Ala 
30 • 

gag aac gtc ttc 144 

Glu Asn Val Phe 

45 

gga ggt etc gac 192 
Gly Gly Leu Asp 



aac gec cag ctt 24 0 

Asn Ala Gin Leu 
80 



get cac etc age acg cag cac aag gac cgt gga ate ccc aac gag tac 288 
Ala His Leu Ser Thr Gin His Lys Asp Arg Gly lie Pro Asn Glu Tyr 
85 90 95 



4 



~ s s f a f 5 e s s g s s e k s = ss 336 

100 lo;) 

360 

tea cac ttc gat ate ggc gcg tgg 
Ser His Phe Asp He Gly Ala Trp 
115 120 



<210> 6 

<211> 120 

<212> PRT 

<213> Arenicola marina 



llTvoXW His Gin Trp val Gin Val Tyr Ser Gly His Gly Tyr Glu 

Ar g Glu Ala Phe Gly Arg Glu Val Phe Leu Glu Met Tyr Asn Gin Ala 

20 2b 
Pro lys Ala ASP Phe Thr Arg val Arg Gly 01. Asn Val Phe 

s « Pro l Ph. Gly Ala His Mat Val Arg val Leu Gly Gly ,a» Asp 

50 55 
Met Cys He Ala Leu Leu Ser Asp Asp Thr Val Leu Asn Ala Gin Leu 
65 

M. His Leu Se* Th, Gin His Lys Asp Arg Gly lie Pro Asn Glu Tyr 
8 5 

Phe Asp Val val Lys Val Ala Leu Met Lys Val Val Pro Gly His Val 



100 105 



Ser His Phe Asp He Gly Ala Trp 
115 



<210> 7 

<211> 390 

<212> ADN ? 

<213> Arenicola marina 

<220> 

<221> CDS 

<222> (1)..(390) 

<223> 

<400> 7 „ mn „ ¥f . „»„ aca ctg tgg agt gag 48 



iVs£ £ S C 5 5 S C Gin S S S S K 

s s s s a s s « s s e s e E s c 

20 ^ J 



96 
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gtg ttc gag gac etc ttc cgc cgc gac ccc gag tec aag aac ctg ttc 
Val Phe Glu Asp Leu Phe Arg Arg Asp Pro Glu Ser Lys Asn Leu Phe 
35 40 45 

. aag. cgc. gtc- aat gtt gac - gac - -atg- aac age ccc gaa ttc cac get cac 
Lys Arg Val Asn Val Asp Asp Met Asn Ser Pro Glu Phe His Ala His 
50 * 55 60 



tgc ate cgt gtt gtc aac ggt ctt gac acc gtg ate ggt etc ctt gac 
Cys He A rcLVal V al A .<=m ( Uy^eu~As^~^r-- Val He Glv Leu Leu A ap" 



65 70 75 80 



gac ccc gac acc ctg aag tec cag etc gag cac ttg gee cag cag cac 

Asp Pro Asp Thr Leu Lys Ser Gin Leu Glu His Leu Ala Gin Gin His 
85 90 95 

aag gag cgt gat ggc ate cac aag acc cac ttc gac gag atg tec cac 

Lys Glu Arg Asp Gly He His Lys Thr His Phe Asp Glu Met Ser His 
100 105 110 

gee ttc ggc gee gtc atg ccc cag gtc age age tgt ttc aac ccc gat 

Ala Phe Gly Ala Val Met Pro Gin Val Ser Ser Cys Phe Asn Pro Asp 

115 120 125 



gca tga 
Ala 



<210> 8 
<211> 129 
<212> PRT 

<213> Arenicola marina 
<400> 8 

Cys Cys Ser He Glu Asp Arg Lys Glu Val Gin Thr Leu Trp Ser Glu 
15 10 15 

He Trp Ser Ala Gin Phe Thr Gly Arg Arg Val Gin Val Ala Gin Ala 
20 25 30 

Val Phe Glu Asp Leu Phe Arg Arg Asp Pro Glu Ser Lys Asn Leu Phe 
35 40 45 

I 

Lys Arg Val Asn Val Asp Asp Met Asn Ser Pro Glu Phe His Ala His 
50 " 55 60 

Cys He Arg Val Val Asn Gly Leu Asp Thr Val He Gly Leu Leu Asp 
65 7 0 75 80 

Asp Pro Asp Thr Leu Lys Ser Gin Leu Glu His Leu Ala Gin Gin His 
85 90 95 

Lys Glu Arg Asp Gly He His Lys Thr His Phe Asp Glu Met Ser His 

100 105 110 

Ala Phe Gly Ala Val Met Pro Gin Val Ser Ser Cys Phe Asn Pro Asp 
115 120 125 



Ala 



<210> 9 

<211> 20 

<212> ADN 

<213> sequence 



artif icielle 



<220> 

<223> amorce PCR 



<220> 

<221> misc__f eature 

<222> (3) . . (3) 

<223> A ou G 



<220> 

<221> misc__f eature 

<222> (6) . . (6) 

<223> C ou T 



<220> 

<221> misc_f eature 

<222> (9) . . (9) 

<223> A, G, C ou T 



<220> 

<221> misc_f eature 

<222> (12) . . (12) 

<223> A, G, C ou T 



<220> 

<221> miscjEeature 
<222> (15) . . (15) 
<223> 



<220> 

<221> misc_f eature 

<222> (15).. (15) 

<223> A ou G 

<4 00> 9 

gartgyggnc cnttrcarcg 



<210> 10 
<211> , 21 

<212> ADN t 
<213> sequence artif icieixe 



<220> 

<223> amorce PCR 



<220> 

<221> misc_f eature 

<222> (4).. (4) 

<223> A, G, C ou T 

<220> 

<221> misc__f eature 



<222> (7) . . (7) 
<223> A, G, C on T 



<220> 

<22.1>. misc^f eature- - - 

<222> (10) . - (10) 

<223> C ou T 

<220> 

<221> miscf eature 

<222> (13) ..(13) 

<223> A ou G 



<220> 

<221> misc_feature 

<222> (16).. (16) 

<223> A ou G 

<400> 10 

ccangcntcy ttrtcraagc a 



<210> 11 

<211> 19 

<212> ADN 

<213> sequence artificielle 
<220> 

<223> amorce PCR 
<220> 

<221> misc_f eature 

<222> (2).. (2) 

<223> A, G, C ou T 

<220> 

<221> misc_jf eature 

<222> (5i..(5) 

<223> C ou T 

<220> 

<221> misc_f eature 

<222> (8) . . (8) 

<223> A, G, C ou T 

<220> 

<221> misc_feature 
<222> (11).. (11) 

<223> A, G, C ou T 

<220> 

<221> misc_feature 
<222> (14).. (14) 

<223> A, G, C ou T 

<220> 

<221> misc_f eature 
<222> (17) . . (17) 

<223> A ou G 



I 



<400> 11 

antgyggncc nctncarcg 



<210> 12 

<211> 21 

<212> ADN b , 

<213> sequence artif lcielle 

<220> 

<223> amorce PCR 
<220> 

<221> misc_f eature 

<222> (4).. (4) 

<223> A, G, C ou T 

<220> 

<221> misc_f eature 

<222> (7) . . (7) 

<223> A, G, C ou T 

<220> 

<221> - misc_f eature 
<222> (10) -.(10) 
<223> C ou T 

<220> 

<221> misc__f eature 

<222> (13) . . (13) 

<223> A ou G 

<220> 

<221> misc_feature 

<222> (16).. (16) 

<223> A ou G 

<400> 12 

ccangcntcy ttrtcraagc a 



<210> 13 

<211> 18 

<212> ADN , . 

<213> sequence artif icieixe 

<220> 

<223> amorce PGR 
<220> 

<2 2 1 > mi s cofeature 

<222> (3) . . (3) 

<223> A ou G 

<220> 

<221> misc_f eature 

<222> (6) . . (6) 

<223> inosine 



<220> 

<221> misc_f eature 



<222> (9).. (9) 
<223> A ou G 



<220> 

<221> raisc^feat.ure . 

<222> (12) . . (12) 

<223> A, G, C ou T 

<400> 13 

aargtiaarc anaactgg 



~<ZTD> 11 

<211> 18 

<212> ADN 

<213> sequence artif icielle 
<220> 

<223> amorce PCR 
<220> 

<221> misc_feature 

<222> (4) . . (4) 

<223> A, G, C ou T 

<220> 

<221> misc_feature 

<222> (7) . . (7) 

<223> A, G, C ou T 

<220> 

<221> misc_feature 

<222> (10).. (10) 

<223> A, G ou T 

<220> 

<221> misc_j£eature 

<222> (13).. (13) 

<223> A ou G 

<220> 

<221> misc_feature 

<222> (16).. (16) 

<223> A ou G 

<400> 14 

ccangcnccd atrtcraa 



<210> 15 

<211> 20 

<212> ADN 

<213> sequence artificielle 
<220> 

<223> amorce PCR 
<220> 

<221> miscjfeature 

<222> (3).. (3) 

<223> C ou T 



<220> 

<221> misc_feature 

<222> (6).. (6) 

<223> C ou T 

<220> 

<221> misc_feature 

<222> (9) . . (9) 

<223> C ou T 

<220> 

<221> misc_feature 

<222> (18) . . (18) 

<223> C ou T 

<220> 

<221> misc_feature 

<222> (12) . . (12) 

<223> A, C ou T 

<220> 

<221> misc_feature 
<222> - (15) . . (15) 
<223> A ou G 

<400> 15 

tgytgyagya thgargaycg 



<210> 16 

<211> 20 

<212> ADN 

<213> sequence artif icielle 
<220> 

<223> amorce PCR 
<220> 

<221> misc_feature 
<222> (3) . . (3) 

<223> A, G, C ou T 

<220> 

<221> miscjfeature 

<222> (6U . (6) 

<223> lu'G, C ou T 

<220> ' 

<221> miscjfeature 

<222> (7)-. P) 

<223> C ou T 

<220> 

<221> miscjfeature 

<222> (9) . . (9) 

<223> A ou G 

<220>" 

<221> miscjfeature 



<222> 
<223> 



(12) . . (12) 
A ou G 



<220> 

<221> misc_f eature 

<222> "(15) . . (15) 

<223> A ou G 

<220> 

<221> misc_f eature 

<222> (18).. (18) 

<223> A ou G 

<400> 16 

cangcnycrc trttraarca 



<210> 17 

<211> 17 

<212> ADN 

<213> sequence artificielle 
<220> 

<223> amorce PCR 
<220> 

<221> misc_f eature 

<222> (3).. (3) 

<223> C ou T 

<220> 

<221> misc_jf eature 

<222> (6).. (6) 

<223> C ou T 

<220> 

<221> misc_f eature 

<222> (9).. (9) 

<223> C ou T 

<220> 

<221> misc_f eature 
<222> (12) . . (12) 

<223> A, G, C ou T 

<220> 

<221> misc_f eature 
<222> (15) . . (15) 

<223> C ou T 

<400> 17 

gaygaytgyg tntgycc 



<210> 18 

<211> 19 

<212> DNA 

<213> sequence artificielle 
<220> 

<223> amorce PCR 



<220> 

<221> misc_feature 

<222> (2) . . (2) 

<223> A, G, C ou T 

<220> 

<221> misc_feature 

<222> (14) . • (14) 

<223> A, G, C ou T 

<220> 

<221> misc_feature 

<222> (5) . . (5) 

<223> A ou G 

<220> 

<221> misc_feature 

<222> (8) . . (8) 

<223> A ou G 

<220> 

<221> misc__feature 

<222> (ID . • (ID 

<223> A ou G 

<220> 

<221> misc_feature 

<222> (17) . * (17) 

<223> A ou G 

<400> 18 

anacraartc rtcnccrca 
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